曹培杰等：教育大模型的发展现状、创新架构及应用展望

日期：2024-03-25 10:03:00

来源：《现代教育技术》

摘要：从通用大模型到教育大模型，是人工智能大模型技术深化发展的重要趋势。基于对教育大模型发展现状、典型案例、潜在挑战的分析，文章认为教育大模型是适用于教育场景、具有超大规模参数、融合通用知识和专业知识训练形成的人工智能模型，是大模型技术、知识库技术及各类智能教育技术的集成，能够推动人类学习和机器学习的双向建构，进而提出了应用驱动、共建共享的创新架构和“以学习者为中心”的未来应用场景，旨在建立人工智能大模型与各类数字化教育应用的开放接口，持续训练和完善能够更好地解决教育专业问题的教育场景模型，形成让广大师生常态化使用的智能教育开放模型集群和知识库，在提炼和萃取深度教育知识的同时，破解人工智能教育应用中的风险和挑战。

关键词：教育大模型；生成式人工智能；智能教育；教育大数据

当前，以ChatGPT、Gemini、文心一言、讯飞星火为代表的人工智能大模型技术迅猛发展，在全球引起了广泛关注。凭借强大的自然语言处理能力，大模型能够完成问题解答、内容创作、代码生成等复杂任务，呈现出解放社会生产力的巨大潜能，可能对人类的信息获取方式、知识结构、教育模式等产生深刻影响。但是，这些通用大模型并不擅长解决专业性的教育问题，从通用大模型到教育领域的专用大模型，是人工智能大模型技术深化发展的必然趋势。教育大模型不是在通用大模型基础上的微调和优化，而是以重构未来教育图景为目标、以开放算法模型架构为基础、以创新教育应用场景为核心的系统性变革。如何厘清教育大模型的理念内涵，并立足技术本质设计系统架构，以进一步打造教育应用新场景，成为关乎教育数字化转型和智能化升级的时代课题。

一、教育大模型的发展现状

1.相关核心概念的界定及辨析

大模型作为新兴研究领域，在学界产生了很多相关概念，如AIGC、生成式人工智能、大模型等。厘清这些概念的内涵，对深化教育大模型认识、构建高质量的教育大模型具有重要意义。

①AIGC（Artificial Intelligence Generated Content）可直译为“人工智能生成内容”，它是相对于专业生成内容（Professionally Generated Content，PGC）、用户生成内容（User Generated Content，UGC）而提出的概念。AIGC是基于监督学习、强化学习、预训练模型、自然语言处理等智能技术，通过已有数据的学习和训练，自动生成各种形式的内容，如文本、图片、音视频、3D交互内容等。

②生成式人工智能（Generative Artificial Intelligence）是一种根据自然语言对话提示词（Prompt）自动生成响应内容的人工智能技术。生成式人工智能的技术实现过程通常由两个步骤组成：首先根据已有的数据进行训练或学习（预训练）；之后当输入新的指示或命令时，根据学习到的意图自动生成新的内容。

③大模型（Large Models）是指具有数十亿到数百亿甚至更多可训练参数的人工智能模型，它是深度学习、GPU硬件、大规模数据集等多种智能技术共同发展的产物。大模型所展现的强大能力实质上是人工智能算法中“量变引起质变”的结果，这一过程被形象地称为“智能涌现能力”，即从原始训练数据中自动学习并发现新的、更高层次的特征和模式的能力。这些能力突出表现为强大而通用的用户意图理解能力、上下文连续对话能力、智能交互修正能力、新内容生成能力等。

总之，AIGC、生成式人工智能、大模型等概念紧密相关，都强调新一代人工智能技术从被动设计走向主动生产的跃迁，代表着新一轮科技革命的演进趋势。但是，三者在技术特征上各有侧重，AIGC更强调生成内容的类型多元，生成式人工智能更强调自主生成性和创造性，大模型更强调算法模型的参数特征。

在此基础上，本研究认为教育大模型是适用于教育场景、具有超大规模参数、融合通用知识和专业知识训练形成的人工智能模型，是大模型技术、知识库技术及各类智能教育技术的集成，能推动人类学习和机器学习的双向建构。它不仅包含人类文明传承所需的教育知识，还提炼了过去只存在于教师头脑中的教育经验和教育方法，能在人机对话交互中引导学习者深入思考，为学习者的自主探索提供指导和支持，并在此过程中不断更新升级，达到更高的专业水平。

2.教育大模型的研究动态

教育大模型具有巨大的变革潜力，不仅引发了人们对教育教学的新认识和新思考，也深刻改变着教育理念、教育内容、教育模式等，甚至会引发学校教育形态的重塑。有学者认为，生成式人工智能通过人机共教、普惠智能、互动评价，可促进教育高质量发展，催生“更加开放包容、交叉学科融合”的教育教学理念，形成“以人为主、教育为辅”的多元化AI教学系统；也有学者认为，教育大模型将重构学校教育结构，使标准化的评价手段逐步转向个性化的评价标准，形成终身制的“学分银行”。

同时，教育大模型也可能带来知识产权纠纷、数据使用偏见、算法滥用等潜在风险，生成内容的质量和安全性仍需提升，普遍存在缺乏连贯性和逻辑性的问题，因此并非所有教育场景都适合使用大模型。有学者指出，教育大模型可能会引发人机关系的失衡，带来技术依赖、数据安全等科技伦理风险。

总之，人工智能的快速发展为教育带来了重要机遇，也存在着一系列未知风险。如何让教育大模型有效支撑教育改革创新，发展有温度的智能教育，已成为全球教育面临的共同挑战。

3.教育大模型的应用现状

目前，全球各国（地区）高度重视教育大模型的应用探索。美国发布《人工智能与未来教学：洞见与建议》，总结了人工智能在教学、学习、评估、研究方面的机遇和风险，并提出了新一代人工智能应用于教与学的七条行动建议。英国发布《生成式人工智能在教育中的应用》，提出教育部门应充分利用各种新技术，为学习者提供优质的教育，使其具备适应社会发展的各项能力。同时，学校方面也尝试开展了相应实践探索。2023年9月，中国香港针对初中生开发了人工智能课程，要求公立学校开设10～14小时的人工智能课程，包括ChatGPT、人工智能伦理和人工智能的社会影响等主题。2023年10月，日本文部科学省宣布将53所中小学作为生成式人工智能试点学校，通过使用新技术来提高教育活动和校务管理的效率。澳大利亚宣布，从2024年起，包括ChatGPT在内的人工智能将被允许在所有学校使用。这些实践探索彰显了新一代人工智能技术在教育中的重要作用，凸显了教育的数字化转型、智能化升级趋势不可阻挡。

4.教育大模型的典型案例分析

在全球范围内，教育大模型正进行着广泛深入的探索发展，已经在口语练习、数学学习、情感分析和个性化推荐等领域形成了解决方案。本研究梳理了五种典型的教育大模型应用案例（如表1所示），对其应用场景、技术进展和现有不足等进行了分析。

表1教育大模型典型应用案例

序号	典型解决方案	研发单位	采用的大模型	场景类型
1	星火语伴	科大讯飞	星火认知大模型	语言学习
2	EmoGPT	华东师范大学	自研大模型	心理疏导
3	MathGPT	好未来	自研大模型	数学学习
4	智海-三乐	阿里云	通义千问	AI知识学习
5	Khanmigo	可汗学院	ChatGPT-4	多学科学习

从应用场景来看，星火语伴主要用于语言学习，支持多语言文本、语音和图片的实时翻译，并能纠正语法错误、提供口语陪练等。EmoGPT用于提供心理疏导，能识别和响应用户情绪，提供持续的心理支持。MathGPT面向全球数学爱好者和科研机构，提供解题和讲题算法，支持用户进行数学解题和练习。智海-三乐用于AI知识学习，提供搜索引擎、计算引擎和本地知识库等功能，支持智能问答和试题生成。Khanmigo通过对话式AI聊天机器人为学习者提供个性化学习方案，涵盖数学、科学等多学科。

从技术进展来看，教育大模型在模型性能、应用场景、技术特点方面展现出明显的优势，其涵盖了大部分学科内容，主要聚焦于自主学习场景，包括知识问答、语言学习、学习引导和教学辅助等。在技术路线方面，“通用+微调”的路径已证明其有效性，许多技术方案以通用大模型为基础，通过指令微调方式实现针对特定学科知识的有效回答。

从现有不足来看，现有教育大模型在准确性、教学内容多样性、支持核心教育场景、包容学习者多样性方面受到限制，存在错误率较高、缺乏共情理解能力等问题；主要侧重于学科知识教学和应试教育情境，在跨学科学习、学习者综合能力与高阶思维培养等方面仍有不足；主要聚焦于支持自主学习，对于如何在真实课堂、同伴协作、混合教学等场景下充分发挥大模型的作用尚未进行有效探索。

总之，大模型在教育领域的应用取得了明显进展，但仍面临着现实问题，需要进一步提升训练数据的质量和规模，尤其是将先进教育理念、教育深度知识和教育核心场景的真实需求深度嵌入技术设计，结合用户反馈进行多轮迭代，形成更智能、更灵活的教育大模型。

二、教育大模型面临的主要挑战

人工智能技术的不断更新升级，推动大模型的规模化应用。部署建立垂直领域大模型，已经在智能客服、数字助理、多模态检索等场景大显身手，未来还将深度融入经济社会发展的各领域、各环节，赋能千行百业智能升级，助力社会生产力跃升。但是，相较于其他领域，在教育中实现真正的自动化和智能化往往面临着更高的要求，因为大部分教育任务是“非程式化”的，可自动化难度更高，在能力、价值、数据、算法等方面还面临一系列严峻挑战。

在能力层面，教育大模型具有强大的内容生成和创造能力，能够直接提供问题的答案，一旦过于依赖大模型，将会导致师生思维惰化，弱化其问题解决能力，进一步加剧知识获取的被动化、浅层化、碎片化。长此以往，将会造成人类思维能力的退化。实际上，教育大模型只是对人类认知能力的模拟，并不具备真正的智慧，并不具备“解未知”“创新知”的能力，引导师生具备驾驭教育大模型的能力和素养至关重要。在价值层面，教育大模型带来的价值偏差，可能会导致出现“幻觉”现象，生成一些错误或者不存在的内容。如果训练用数据带有某种价值观，那么该与价值观相符的语料便会被重复，从而被转换器识别为关键文本并作为标准答案输出。一些基于欧美语料库的大模型会借助文本、图像、视频等内容产品的掩盖，以难以察觉且难以抵制的方式集中投射“价值观和文化标准答案”，潜移默化地对青少年进行价值观渗透，并导致弱势群体“数字殖民”的升级。因此，必须加强教育目标和价值引导，注重“价值观对齐”，并建立相应的风险防范和干预机制。在数据层面，教育大模型需要海量的训练数据，这进一步扩大了数据安全和隐私保护风险，师生隐私问题将会成为一个前所未有的重要挑战。我们既要强化教育数据安全保障，在不改变大模型生成内容质量的情况下对原始数据进行加密和解密，防止师生隐私数据泄露，同时也要建立教育数据共建共享的有效机制，扩展高质量的公共训练数据资源，推动教育大模型的健康可持续发展。在算法层面，以深度学习为技术基础的教育大模型通常被视为“黑箱”，难以解释其决策过程，可能会出现难以理解和接受的教育行为，甚至会动摇学习者的主体地位。从某种角度来说，个性化学习算法似乎提高了信息推送的精准度，但也可能使学习者陷入“信息茧房”，只能看到与自己已有观点相符的信息内容，导致其视野越来越狭隘，并进一步影响学习者的全面发展。

目前，教育大模型正处在研发应用的关键时期，需进一步提升训练数据的质量和规模，尤其是将先进教育理念、教育深度知识和教育核心场景的真实需求深度嵌入算法模型的底层架构，并结合学习者需求进行更新迭代，从而实现教育大模型的实践落地。

三、教育大模型的创新架构

当前，教育大模型研发主要采取两种技术路线：一是直接调用通用大模型，通过微调或提示学习的方式使之具备一定的专业能力；二是利用教育领域专业数据，专门训练用于解决教育任务的大模型。然而，虽然这两种技术路线都取得了一定的进展，但实现效果仍有待提升。其问题在于：由于缺乏足够的专业数据训练，加上教育领域的深度知识不够，导致当前大模型的智能性不强，难以灵活处理复杂多变的教育任务。而如何研发教育大模型，破解之道在于将两条技术路线整合起来。这并非简单相加，而是利用应用驱动、共建共享的方式，通过开放数据接口源源不断地获得来自常态化教育应用中的数据，实现“大模型”和“小模型”、“大数据”和“小数据”的有机结合，满足师生日常教学的实际需求，打破“数据孤岛”；同时，以专家知识库作为大模型的补充，将教育知识和教学法有意识地“教”给大模型，并整合应用各类智能教育技术，形成具有灵活处理各类复杂教育任务的专用大模型。

1.底层逻辑

教育大模型的核心竞争力既不是技术，也不是数据，而是对教育的深度理解。要把“学习者中心”的理念作为研发教育大模型的底层逻辑，融入算法模型的架构设计和原型开发的全过程。“学习者中心”就是以学习者主动性、创造性发展为目的，围绕学习者需求、兴趣和能力配置教育资源，设计学习活动，规划成长路径，实现大规模因材施教。在这种理念的指导下，教育大模型不再是冷冰冰的机器或工具，而是促进学、优化学、激发学的重要助手和协同主体，帮助学习者从被动的知识接受者变为主动的求知者、探究者和合作者。但是，这种“学习者中心”不是“精准刷题”，更不能陷入“高效应试”的窠臼，而是要秉持“每个学习者都是全面发展的人、综合立体的人”的理念，利用教育大模型了解学习者的成长状态，以提供个性化、适应性、有温度的学习支持和教学指导服务，促进学习者全面而个性的发展。

2.开放创新架构

教育大模型是以通用大模型为基础，通过连接各类教育数字化应用，持续训练教育场景模型，不断提高解决教育专业任务的能力。教育大模型的开放创新架构分为三层，分别是基础能力层（L0）、专业能力层（L1）、应用服务层（L2）。

图1教育大模型开放创新架构

L0：基础能力层。该层包括大语言模型、视频分析模型、学科大模型、情感计算大模型等。其中，大语言模型负责处理文本数据；视频分析模型负责处理视频数据，如课堂录像等；学科大模型负责处理学科专业任务；情感计算大模型负责处理身心相关指标，涉及心理健康、学习过程情绪监测、人际交互情感分析等任务。在任务完成过程中，多个大模型协同工作、互相支持，任务中心对不同模型输出的结果进行整合处理。

L1：专业能力层。该层包括两部分：①教育场景模型库。教育场景模型库主要包括学习行为分析模型、课堂互动分析模型、能力评估模型、学业预测模型、情感计算模型、决策辅助模型等，该库预先配置一部分常用模型，在应用过程中持续优化、扩充。②专家知识库。专家知识库包含两类知识，一类是学科内容知识，另一类是学科教学知识。两类知识整合后，以多维动态知识图谱的形式进行存储和呈现。随着教学过程不断发展，广大师生既是知识图谱的使用者，又是共同编辑者、创作者，最终形成学习者个人知识图谱以及班级、学校、区域等不同层次的共享知识图谱。

L2：应用服务层。教育大模型最重要的创新理念就是“应用驱动”，即将各类教育数字化应用接入大模型，在大模型为应用赋能的同时，将应用数据源源不断地传入大模型，持续提高大模型的教育专业能力。这些应用涵盖教、学、评、管等各类教育场景，通过开放数据接口，形成统一标准的高质量训练数据。同时，师生用户可通过统一使用门户发出任务指令，大模型根据任务性质，自动调用相应的功能模块，形成一种以学习者为中心的应用模式，达到即便没有任何人工智能知识仍然可以无障碍地使用大模型的效果。

3.建设部署思路

教育大模型并非单一、封闭的模型，而是一个开发者和用户共同参与、持续完善的过程，由专业团队研发模型基础架构与核心部件，各类用户在应用过程中共同参与完善优化。广大师生和各类教育数字化应用开发者都是教育大模型的使用者，也是教育大模型的贡献者、建设者，由此形成共建共享的智能教育创新生态，其会经历基础建设和应用完善两个重要阶段：①在基础建设阶段，依据“数据+知识”双轮驱动的人工智能技术路线，集成多种教育人工智能技术，建立模型体系、应用体系、数据体系，形成模型持续训练机制。从技术实现的角度来说，该阶段包括大规模多元教育数据采集、数据预处理、特征工程、模型设计、模型预训练、微调与迁移学习、模型评估与调优七个步骤。②在应用完善阶段，教育大模型不断进行算法和模型创新、数据应用创新、应用开发创新。

四、教育大模型的应用展望

教育大模型将从学习空间、学习资源、教师角色三个方面推动教育数字化转型和智能化升级，形成人机协同共生的教育新生态。

1.学习空间互动生成

在教育大模型支持下，学习者通过人机互动获得学习支持、创生学习成果，建构个人学习空间和集体学习空间，形成物理空间与网络空间相互融通的学习场景，让所有学习者都可以在任何地方、任何时刻获取所需的任何信息。一方面，学习者利用知识图谱、数字教材等工具，整理创作学习成果集、建立个人和团队知识库、协作编写“数字学案”，形成基于学习资源常态化共建共享的学习共同体，并在此过程中发展出学习资源的用户评价和标识机制，由知识消费式学习转变为知识创生性学习。另一方面，学习者的学习经验被智能算法从学习行为数据中提炼出来，总结成为新的学习法，不断优化完善教育教学策略模型和知识库，实现人类学习和机器学习的双向赋能。

2.学习资源按需供给

借助教育大模型的学习分析能力，缩小教育资源需求侧与供给侧的鸿沟，为学习者提供个性化学习资源，破解优质教育资源供给与学习需求匹配的问题。一方面，建立资源应用过程中的学习需求分类体系。在已知的资源分类基础上，由学习者对资源类型进行标识，不断扩展丰富资源分类框架，让资源标识更加接近真实的学习需求。从技术角度来看，这个过程其实是教育大模型与人类价值取向的“对齐”，使大模型遵从人类的价值、偏好和伦理原则，确保为学习者提供海量、适切的学习资源支持。另一方面，建立以用户为中心的教育资源评价机制，根据师生应用反馈，促进教育资源的优胜劣汰，激发广大师生应用资源的积极性，并从中发现、培养一批优质教育资源建设者，推动“教育专用资源”迈向“教育大资源”。

3.教师角色转型升级

教育大模型将逐步取代重复低效的教育劳动，提升教育教学工作的科学性和创造性，推动教师从“教的专家”转向“学的专家”，通过创造性的教学设计，为每个学习者提供个性化支持。一方面，依托智能知识库和应用集，开展大规模、精准化的知识传递，解放教师的时间、精力和创造力，让教师专注于学习组织和指导活动，催生深层次师生对话。另一方面，教师逐渐成为学习指导者和教学研究者，有望通过人机协同的学习数据分析和诊断来了解学习者在学习中的思维过程，并基于学习者的真实学习状态进行有针对性的教学活动设计，推动经验性教学逐渐走向循证式的教育专业实践活动。未来教师既是富有经验和智慧的实践者，又是善用大数据分析和智能教研工具的研究者，通过进一步探究人工智能条件下的教育新规律和教学新方法，最终形成智能教育的新知识体系。

五、结语

目前，我国的教育大模型技术与国际领先水平之间还存在差距，但发展势头良好，积累了一定的科技实力，在海量数据方面具有明显优势，能够依托教育领域大规模、多模态、长周期的教育数据，对学习过程进行准确捕捉与深度理解，以进一步明晰教与学的底层机制，推动教育算法的快速迭代，建立更具针对性、专业性、准确性的大语言模型，实现弯道超车。同时，教育大模型将会带来一系列全新挑战和未知风险，应尽快明确其开发原则和使用范围，加强伦理风险评估审核，制定有针对性的师生使用指引，确保在教育大模型开发应用生命全周期中彰显教育公平、包容、可持续发展的底色。

来源|《现代教育技术》2024年第2期

作者|曹培杰、武卉紫、左晓梅（中国教育科学研究院数字教育研究所）、谢阳斌、杨媛媛、沈苑、黄宝忠（之江实验室智能教育研究中心）