10. 人工智赋能教育 (AIED) 的现状 (1)

这档节目讨论了人工智能(AI)在教育和学习中的应用。AI教育,与人工智能、学习科学和认知科学密切相关,学者称之为“认知技术和教育的纽带”。AI在教育领域的应用主要分为三大类:面向教育机构、面向教育者和面向学习者。不仅仅局限于在学校帮助师生,还能应用于传统学校教育之外的场景。

AI在招生和电子监控方面的应用,类似于公司的人力资源部门和金融系统中的风险识别工具。AI在招生和电子监控应用中存在的争议,欧盟认为这些应用属于高风险,因为它们直接影响教育和学生的行为。2位主持人提到了美国高等教育机构使用AI辅助招生,以降低成本并消除人为偏见,但同时也存在算法偏见的风险。回顾了一个案例,德克萨斯大学开发的名为GRADE的AI系统,因复制了其试图解决的偏见问题而被放弃。强调了提高算法透明度和公正性的必要性。

讨论了新冠疫情期间电子监控在在线课程和考试中的应用增加,以及由此引发的隐私和心理健康问题。

AI被用于协助教育者进行评分和提供反馈。但主要侧重于总结性评估而非形成性评估。Turnitin等工具被广泛用于检查抄袭。学生使用Grammarly等工具来改进写作,但AI生成内容的准确性和原创性值得关注。

AI辅助技术被用于课堂管理和监控,例如监控学生的视线和注意力,这引发了伦理问题。

AI可以帮助教师进行专业发展,解决他们工作负担过重的问题5.
介绍Google Classroom,简单分析了它的优缺点,以及引发的争议,例如,一些学者认为教室正在“谷歌化”,教育因过度依赖谷歌技术而被商业化。
最后,提到了Elon Musk发布了Grock 3,以及微软发布了量子芯片Majorana。





  • 叶老师,橙子Author for 4edu.ai
  • 22/02/2025
  • Education, AI
  • Podcast

第一季,第九集

Y (叶老师): 欢迎大家继续收听我们的节目!我们两位课代表又来了。

C (橙子):是的。大家好。欢迎大家收听我们的节目。

Y:  今天我们两位课代表领着大家继续讨论AI赋能教育和学习这个话题。我们来探讨一下人工智能赋能教育的现状。AI技术赋能教育,赋能学习, 是一个新兴的研究领域,或新兴的学科。 名字是所谓的AI in Education (AIED) ,人工智能应用于教育。这个学科和人工智能,学习科学和认知科学密切相关。学者们将这个学科称为 "认知、技术和教育的纽带"。

C: 就是说,这个学科既包含了认知科学,又包含了技术和教育。是这3个学科融合,交叉意思,对吗?

Y: 对。 AI在教育和学习中的应用,根据受众不同,主要可以被分为三大类,:面向教育机构,面向教育者,以及面向学习者。 

C: 叶老师,你提到的是教育者和学习者,那我想确认一下:就是说AI技术不仅仅是帮助在校学生和老师,应用在传统的学校教育中;而是可以适用不同的教育场景,比如说家庭教育或是公司培训; 还有适用不同年龄段的学习者,从幼儿园的小朋友,到年级比较大的人士,都是可以被AI赋能的,对吗?

Y: 对。那我们今天就具体来展开讲一下这三个类别的应用,好吗?

C:好。

Y: 那人工智能赋呢第一个类别,是教育机构。面向教育机构的AI技术被应用在招生,监考,课程规划、排课,给学生分配经济援助;还有识别某些学生是否有辍学,或其它方面的风险。

C: 那听上去的话这些工具具有明确的行政功能。如果和商业功能类比的话,招生就好像公司里HR (人力资源);分配经济援助,识别辍学和有其它风险的学生,就好像金融系统的风险识别信,与信用考量的工具,对吧?

Y: 可以这么类比。 在这类AI在招生和电子监考领域的应用颇有争议。在我们之前介绍过的欧盟AI法案中被定义为高风险使用案例。 因为这类AI的应用对如何分配教育资源有直接的影响。也对学生的行为有直接和深远的影响。

C: 那我们给大家讲一下一个AI在招生中使用的实例吧?

Y: 可以。我所理解的,许多高等教育机构,主要是美国的高等教育机构,使用市面上的人工智能辅助招生软件来支持它们招生流程,颇有争议。这样做的目的是为了降低成本,同时希望使招生系统更加公平,帮助消除人为偏见,就是做决策的人产生的人为偏见。

C:你提到人为偏见,让我想起有一个系统,在美国司法系统中广泛使用过,缩写是COMPAS,Correctional Offender Management Profiling for Alternative Sanctions。它也挺有名的,尤其是在量刑和假释决定中被广泛使用。然而,COMPAS 引发了许多关于算法偏见的讨论。

Y:我们把它拉回来讲。美国的高校运用技术是希望消除决策中人为的偏见。你刚才讲的这个COMPAS,在美国司法系统中使用的软件,所引发的讨论,更是证明了技术本身是会有偏见的。你是这个意思吗?

C: 对。我记得当时非裔美国人被错误地评估为高风险的概率,这就是明显得偏见存在的证明嘛。

Y:你是指ProPublica 的研究吧,他们分析了佛罗里达州超过 10,000 名刑事被告的数据,发现 COMPAS 在预测非裔美国人再犯风险时存在显著偏差。而不是事实存在偏差,是系统预测结果。

C:是的。这样的话,系统的准确性就很有问题。

Y: 对,这就违背了司法系统的初衷。没办法公正地做出评断。拉回到教育来说,德克萨斯大学奥斯汀分校开发了一套名为 GRADE 的系统,根据申请者的考试成绩、先前的学术背景和推荐信来建议是否录取他们,并声称至少节省了 74% 的审查时间。当然就是提高效率,降低成本了。然而使用几年后这个系统 被放弃,因为它正在悄无声息地复制它想要解决的问题。那么无论是司法系统的COMPAS,还是德州大学的GRADE系统,本身是为了解决人的决策偏见,但事实证明系统也不是完全公正的,没有bias偏见的。

C:所以我就在想,算法透明度的提高确实是很有必要的。公众不是很理解算法的工作原理,很难审查,也就很难改进。应该采用新的公平性指标,来促进算法的公正性。现在的技术,虽然有很多异议,但肯定使用趋势肯定是越来越多。

Y: 对呀,监管方面,by design, 还是 by testing?  现在业界有这两种说法,by design 就是设计系统的时候就要考虑透明性,可解释性,公平公正,等这些问题。而不是系统出来,使用之后,再去规范它。不过,这个就说得有点远。回来说AI在教育里的运用。还有一个部分是电子监考。在 COVID- 19 流行初期,许多课程都转移到了网上,许多考试也是一样。考试监控公司(或称电子监考公司)的业务大幅增长。电子监考的目的是通过使用人工智能辅助摄像头和麦克风自动监控学生。在学生完成在线考试时,通过扫描他们的面部、跟踪击键和鼠标移动来确保学生不作弊。然而,这些工具引起了巨大争议。

C: 我可以理解这些争议。因为很可能许多人认为自己的隐私被侵犯。

Y: 不光是入侵学生隐私,这个首当其冲的问题。研究证明,这样会加剧学生心理健康的问题。这其实不是技术赋能教育积极的案例。

C: 这些AI案例充分说明了使用AI系统所涉及的伦理方面的考量。如果听众朋友们对有关AI伦理的讨论感兴趣,请回头听一下第4集的内容。

Y:我们前面所讨论的,是AI技术赋能教育机构,这一方面的内容,这是第一类。第二类,是面向教育者。前面橙子也说了,是不同场景下的教育者。技术对教育者的支持,实际上也是分为好几类,我们慢慢开始讲。我们先讲最多的使用工具,协助教育者评分,也就是改考卷,或是改作业,然后提供反馈。这是目前应用最多的,也是得到经费最多的。

C:这里应用是挺广泛的。学校都在用自动评分系统,节省了老师很多的经历与时间。

Y:对,落脚点还是提高效率降低成本。协助评估的工具可以分成两大类,一类是简单粗暴的,防止学生抄袭和作弊。目前美国和欧洲市场上最大的应用叫Turnitin,主要是面向教育者。如果交了论文进去,他会在这个系统里走一下,看看这个学生到底有没有作弊,有没有抄袭。顺便提一下学生也用到一些应用。他不是有意地去抄袭,而是防范自己无意的抄袭,或者是引用文件做得不够好。因为大学里,如果论文里的引用超过一定的百分比,他会算你是抄袭。所以学生会在一个叫Grammarly网站里自己先自测一下。

C:这是不是和近年来人工智能帮助写作,被使用的越来越多有关系?因为很多学生或是研究者在写论文或是报告时都会用AI协助。但是你不知道系统给的多少是别人的东西。或者说你不知道系统的准确性有多少。

Y:之前已经有了。Turnitin在2022年之前就是在帮助学校的老师减轻他们的工作。现在大火,因为技术迭代嘛,他们用AI测AI。这样的话,用机器来测机器,有多少的意义这个是另外的讨论。这是防止抄袭。教师还有一个劳动密集型的任务,给学生做评估。再把做论文,做作业的例子拿过来,一部分是老师要评估你的作业做得怎么样,然后给个反馈。在教师任务中一个重要的部分。现在AI可以帮老师做一部分评判。但是现在看,他能够做的主要是一些总结性的评估。他能够根据之前的一些参数,评估论文写得如何,写一个比较合理的书面评估。但是在教育中,做这个总结性的评估其实只是一部分。

C:那还有什么其他的?

Y:教育学中的评估其实有两大类,一种是总结性的评估(summative assessment),还有一种是形成性评估(formative assessment),就是更重要的对学生学习过程的一种评估。如果是最后一个结果的一个评断,的确系统是可以帮你做的,单单根据作业来做一个评断。如果想做不到更多的知道学生如何创造出这样的一个成果,创造过程中的成长,系统目前还是没有办法做出这种评估。formative assessment定义就是“对学生日常学习过程中的表现、所取得的成绩以及所反映出的情感、态度、策略等方面的发展” 做出的评估,是对学生一个循序渐进的观察,是老师自己反思。目前对系统来说还是很困难。评估以外,老师很多时间还要备课,写教案。现在市面上也有相当多的一些工具帮助老师做这些。比如说备课中所用的很多资源,看看这些资源是否适合特定年龄段的学生,策划这些资源的使用。我们会把这些工具放在我们的文本中,让大家去参考。就不为这些工具做广告。如果大家感兴趣可以去看一看试一下。

C: 你刚才说评估,我插一句:这个自动化评估是不是也属于高风险系统?

Y: 的确是。AI技术用于教育行业,本身就是属于高风险领域。也就是说AI技术用于教育行业,无论是在哪个方面的应用,都是高风险。因为他的影响实在是太大了。

C:所有涵盖它的应用全是高风险的。

Y:对呀。说到高风险,另外一个大家马上可以看到的是,有些课堂的管理,甚至课堂的监控也有AI辅助技术。就像前面讲的监考一样,AI来监控学生的视线,他的目光投向哪里,从而推断是否专注于老师交给他的任务,老师吩咐他们做的事情。就会回到我们前面所讲的,监控对学生心理所产生的一些副作用,或是对学生行为的影响。马上会联系到和伦理相关。

C:我可以理解。要是有人用摄像头时刻看着我,我也会觉得很有压力。

Y:对。面对教育者和话,因为教育这个行业中,教育者自身专业的发展是非常重要的,不能说是被忽视,可以说是愧于应付。因为教育是个劳动密集型的工作,平时需要做的事情实在是太多了,自己专业方面的发展就愧于应付了。有研究表明,教育工作者在前三年还有投入在自己工作的发展;之后自己投入的精力,或者自己能够投入的精力和时间就越来越少。所以现在有一些AI工具帮助教育者自身的职业目标和兴趣,帮助教师自身的成长。

C:我想起了Google classroom。是一个很有名的软件。你能不能用它来做例子,给我们讲一讲AI是如何赋能教育者的。

Y:我试一下。Google classroom在欧美用的比较多。用它来做例子,对我们一部分的听众没有直接的影响,或是直接的认知。

C:如果我不用的话,我也不知道他具体是怎么操作的,有哪些特点,有哪些优缺点之类的。

Y:Google classroom设计非常简洁。我看过一个数据,到2024年,全球2.5亿使用者,使用的非常广。它的特点就是与他和Google的其他应用无缝集成,比如Google Docs、Google Drive、Google Meet等,方便教师和学生共享和管理资料。另外一个优点是减少了对纸张的依赖,有助于环保。都是数据资料。而且灵活性高,不需要去找老师,老师也不必时时在线。学生和教师可以随时随地访问课程资料,支持远程学习。在平台上进行讨论和互动。

C: 那么坏的方面呢?肯定有一些问题的。

Y:坏的,或是说不足之处吧:首先,是向任何的AI技术一样,有隐私问题。数据收集和使用,Google也有被告上法庭的先例。因为数据的滥用,他们也被告过。地域限制,在某些地区无法使用。

C:对。而且不是每个人都有经济能力去买一个电脑,连上互联网,来使用Google Classroom。

Y:对,经济也是一方面。现在有学者去研究Google Classroom在教育中的应用。他们提出了一个论点,教师在谷歌化。他们把技术引用到了教育生态系统里面,人非常依靠这个技术。谷歌是个商业公司,商业巨头。教育谷歌化延伸得讲,就是教育商业化。谷歌是如何做到吸引全球这么多使用者的呢?他们用了一种聪明,也是简单粗暴的办法,谷歌会找到学校管理人员,向他们展示公司的直观应用,并告诉他们学校如何通过使用这些服务来节省开支。通过商业化的操作把技术应用到教育里面。最大的卖点,还是节省开支提高效率,给你带来便利。目前来看,教育谷歌化,来给教育者赋能,是要付出一定代价的。

C: 嗯,有利也有弊。

Y: 对,如何事都是双刃剑。谷歌技术在教育生态系统里的侵入,带来了一些隐私风险。还有一些学者指出,儿童会迷上他们的设备,和产品。在他们还没有很多辨别能力,选择能力的情况下,谷歌把自己的产品和理念灌输给学生。这些学生在未来有可能成为他们潜在的客户。我们在节目文本里也附上一个有意思的研究报告。今天时间差不多了。在下期节目中,我们再和大家细细地讲一下AI赋能学习者,这个大话题。

C: 最近的2个新闻比较震撼,让我很兴奋:

  • 马斯克发布了他们最新AI版本:Grok3。这个号称由世界上最多的GPU训练出来的模型,不负众望,多个性能上都超过或媲美Gemini、DeepSeek和GPT-4o等对手。更令人兴奋的是,马斯克在X上宣布,Grok3将对所有人免费。现在还不清楚这个免费的内容具体是什么,但是啊,非常让人期待!大家有机会一定要试一试。机会难得!
  • 微软发布首款 量子芯片“Majorana 1(马约拉纳1)” 。这是个巨大的技术突破, 实现了从理论研究到实际应用的跨越。大家可以想象一下:一个可以放在手掌中的芯片却能够解决当今地球上所有计算机加起来都无法解决的问题!这个芯片所用的材料,是他们新的发明,叫拓扑导体。理论上,这个方法可以把上百万个量子比特放在一个芯片里。有关的内容我们还要消化一下,下一期节目里争取和大家做个介绍。


References:
课程计划,备课:

  • ClickUp: ClickUp Brain 可以生成课程计划并提供个性化建议以改进它们。它与其他教育工具集成,以简化规划过程。
  • Education Copilot: 该平台提供 AI 生成的课程计划模板、教育讲义等,帮助教师节省准备时间。


资源策划:

  • Curipod: Curipod 使用 AI 策划与课程标准一致并根据学生需求量身定制的互动课程材料和活动。
  • Khan Academy: 虽然主要以其教育内容而闻名,但 Khan Academy 使用 AI 根据学生的进度和表现推荐资源和活动。


课堂管理:

  • Classcraft: Classcraft 使用游戏机制和 AI 监控学生行为和参与度,提供实时反馈和干预,帮助管理课堂环境。
  • TeachMateAI: 该工具协助完成各种课堂管理任务,包括创建作业、课程计划,并为学生提供个性化反馈。


教育者自身的专业发展:

  • Coursera: Coursera 根据教师的兴趣和职业目标提供 AI 驱动的课程和专业发展机会推荐。
  • Edthena: 该平台使用 AI 通过视频分析提供关于教学实践的个性化反馈,帮助教师改进教学方法。




How We Analyzed the COMPAS Recidivism Algorithm — ProPublica
How Google Conquered the Classroom: The Googlification of Schools Worldwide in 2025 | Research.com

名人名言

Tell me and I forget, teach me and I remember, involve me and I learn. - Benjamin Franklin
“告诉我,我会忘记;教我,我会记住;让我参与,我就会学到。” - 本杰明. 富兰克林