文章分享 | 《PRPER》:运用人工智能追踪学生能量观念理解的发展轨迹
时间: 2026-04-25 发布者: stem 文章来源: STEM教育研究中心 审核人: 浏览次数: 10

图片

在当今科学与技术迅猛发展的时代,能量概念不仅是物理学的核心基石,更是理解能源转型、气候变化等全球性社会议题的关键。然而,大量研究表明,绝大多数学生在完成基础教育后,仍未建立起足以参与社会能量话语的深层理解。传统的学习进程研究多基于横断面数据,虽能描绘出不同年级学生的平均理解水平,却难以揭示个体学生在教学过程中真实、动态的学习轨迹。这一盲点限制了教育者提供及时、个性化支持的能力。

近期,一篇发表于《Physical Review Physics Education Research》的研究论文《Tracking students’ progression in developing understanding of energy using AI technologies》为我们带来了突破性的视角。该研究由德国莱布尼茨科学与数学教育研究所、柏林自由大学等机构的研究者共同完成,首次将机器学习与自然语言处理技术深度融合,用于分析学生在数字化学习环境中产生的细粒度、纵向数据,从而识别并解析了“高效”与“低效”两种截然不同的能量概念学习轨迹及其内在成因。

研究背景:能量理解的四个核心层面与学习进程的挑战


学界普遍认为,深度的能量理解包含四个循序渐进的层面:1) 能量形式,2) 能量的转移与转化,3) 能量耗散,4) 能量守恒。学生通常按照此顺序发展理解,但许多人在中学毕业时仍未能掌握较高的层次,特别是守恒观念。以往的学习进程研究多依赖于在不同时间点对同一批学生进行重复测试,这种方法不仅耗时,还可能干扰正常教学。数字学习环境的普及为解决这一难题提供了可能,它能够持续、无感地收集学生在学习任务中产生的海量交互数据(如开放式回答、选择题、拖拽操作等)。然而,如何从这些“大数据”中提取有意义的教育学洞察,成为了新的挑战。人工智能技术,特别是机器学习,正成为应对这一挑战的有力工具。

研究方法:融合证据中心设计、随机森林与自然语言处理


本研究设计了一个为期十周、面向德国9-10年级学生的教学单元,主题为“学校的能源供应挑战”。该单元基于项目式学习理念,并严格遵循 “面向学习进程分析的证据中心设计”(ECD4LPA) 框架进行构建。这意味着,单元内的每一个教学任务都同时承担着教学与隐蔽性评估的双重功能。

研究数据来源于一个数字工作簿(基于Moodle平台),共收集了548名学生的完整交互数据。经过严格的排除标准(如剔除前后测分数极端或接近平均分的学生),最终对172名学生的数据进行了深入分析。

研究通过两个核心步骤回答其研究问题:

  1. 轨迹分类与特征识别(随机森林分析):研究者根据学生的后测分数(采用项目反应理论计算的加权似然估计值)将其划分为“高效轨迹组”(分数高于均值)和“低效轨迹组”(分数低于均值)。随后,利用随机森林这一机器学习算法,基于学生在三个教学模块评估点(共11个任务)的表现,来预测其所属轨迹类别。该分析不仅能达到较高的分类准确率(F1分数约0.69),还能通过计算“特征重要性”来识别哪些任务对于区分两类轨迹最为关键。

  2. 知识差异深度挖掘(自然语言处理):为了探究两类学生在知识运用上的本质区别,研究者对五个关键的开放式文本任务答案,运用了先进的自然语言处理技术。流程包括:使用德语BERT模型将句子转化为高维向量(嵌入),通过UMAP进行降维,再利用HDBSCAN进行聚类分析。最终,研究者对形成的聚类进行人工解读,并对比两类学生在各聚类中句子分布的差异。

核心发现:高效与低效轨迹的分水岭


1. 随机森林分析:预测、分类与关键任务

  • 仅使用第一个教学模块的评估任务(及前测),随机森林模型就能以较好的准确度(准确率0.71, F1分数0.69)预测学生的最终学习轨迹。这表明,学生在单元早期的表现对其最终成果具有强烈的预示作用。

  • 前测分数是预测力最强的特征,凸显了先前知识在整合新知识中的基础性作用。

  • 在整个分析中,预测力最强的任务(如t1.1, t1.4, t1.2, t3.3, t2.3)大多涉及能量的转化概念,或要求将转化与能量形式、能源供应等概念结合应用。相反,纯选择题的重要性较低。这揭示了对能量转化概念的深度理解和跨概念连接能力,是区分高效与低效学习轨迹的核心。高效轨迹的学生更早、更牢固地掌握了能量学习进程中的第二个关键阶梯。

2. 自然语言处理分析:知识网络与论证质量的差异

对开放式回答的聚类分析,展现了两类学生在知识组织和运用上的微观差异:

  • 在需要论证的任务中,低效轨迹的学生更倾向于依赖论述的表面结构(如“因为A给出了例子”)进行判断;而高效轨迹的学生则能更多地聚焦于论证内容本身的逻辑与证据质量。

  • 在分析e-fuels对发电厂影响的任务中,差异尤为显著且具有统计学意义。低效轨迹学生的回答多停留在对e-fuels的一般性描述(如“更环保”)或单纯断言排放会减少;而高效轨迹的学生则能频繁、正确地运用效率概念进行推理(如“生产e-fuel消耗的能量多于其产生的能量,因此效率会下降”),并展现出更具体的领域知识。

  • 在评价可再生能源利弊的任务中,低效轨迹学生更多提及“依赖天气”、“环保但成本高”等常见但相对割裂的观点;高效轨迹学生的回答则更整合,能围绕环境友好性进行连贯阐述。

这些发现共同指向一个结论:高效轨迹的学生并非仅仅掌握了更多的“知识点”,而是构建了更紧密、更整合的知识网络。他们能够灵活调动多个能量概念(特别是转化概念),并将其应用于解决复杂、非标准化的实际问题中。这与专家-新手研究中的发现高度一致。

讨论与启示:迈向精准化、支持性的教育


本研究证实,基于ECD4LPA框架设计的教学单元,结合机器学习分析,能够在不增加学生额外测评负担的情况下,实现对个体学习轨迹的可靠追踪与早期识别。这对于教育实践具有深远意义:

  • 为教学设计提供实证反馈:研究明确指出,那些促进学生连接不同能量概念、应用转化知识于新情境的开放式、建构性任务,对于推动学生迈向高效学习轨迹至关重要。课程开发者应着力设计更多此类任务。

  • 赋能教师实施精准干预:通过技术平台,教师可以近乎实时地获得关于学生所处轨迹及薄弱环节的分析反馈。这使得在单元中期甚至早期,为有滑向低效轨迹风险的学生提供针对性支持(如补充关于能量转化的特定辅导或学习材料)成为可能。

  • 拓展教育研究方法论:本研究示范了如何将机器学习(如随机森林)的预测力与自然语言处理的深度解读能力相结合,实现教育研究中的“计算扎根理论”。这种方法既能处理大规模数据,又能保持对质性意义的敏感,为探索复杂的学习过程提供了新范式。

局限与展望


研究者也坦承了本研究的局限,如每个评估点的任务数量有限、部分学生数据缺失需通过插补处理、以及一些NLP分析结果的统计显著性不足等。未来的研究可以在更长时间尺度上收集更密集的任务数据,并尝试利用教学单元中的每一个互动任务进行全流程分析,以实现更精细、更动态的学习轨迹描绘。

论文信息:Wyrwich, T., Kubsch, M., Drachsler, H., & Neumann, K. (2025). Tracking students’ progression in developing understanding of energy using AI technologies. Physical Review Physics Education Research, 21(1), 010152. DOI: 10.1103/PhysRevPhysEducRes.21.010152