千百年来,教育工作者都明白,最佳学习方式便是一对一教学,即按照学生自身的时间和学习速度来辅导。这就是亚历山大大帝和他的老师亚里士多德所采用的方式。如果亚历山大对某一概念有任何疑问,我能想象亚里士多德会为他放慢教学节奏。如果亚历山大有理解军事战术的天赋,我确信亚里士多德会加快他的军事课教学速度,或是提升教学难度。在这样一对一的教学模式下,学生从不会感到困惑和无趣。这并不仅仅发生在遥远的过去,如今,顶级运动员和音乐家也接受一对一的指导。然而,如果没有助教或技术的支持,很难想象仅仅一位教师在同时面对30位学生时,还能达到一对一指导的效果。
早在18世纪,我们就已有了乌托邦式的想法,那就是为每个人都提供大众教育。我们从前没有能为每位学生配备私人教师的资源,所以我们将学生们分为30人左右一组,并采用标准化的教学方式——通常采用大课和周期性评估的方式。尽管这一教育体系并不完美,但在当时的环境下它还是极大提升了社会整体教育水平,提升了全球的识字率和受教育率。但这的确不是大多数学生的最优选。例如,传统的教学节奏会迫使一些学生在还未掌握基本概念的情况下,就转向更高阶的课题。这种方式会造成他们知识上的漏洞,并随时间不断累积。如今,我们仍能在每间教室和每个学科看到这些漏洞造成的影响。在美国,大多数学生,包括那些高中毕业后继续上大学的学生,数学水平都没有达到进入大学的程度。事实上,大多数大学新生会被大学告知,他们在代数上有太多的漏洞。为此他们需要去补修中学水平的代数预科的无学分补习课程。此外,四分之三的高中毕业生写作能力也不尽如人意。
1984年,著名教育心理学家本杰明·布鲁姆尝试通过个性化和一对一的教学方式,来打破传统的班级授课制。作为芝加哥大学的研究员,布鲁姆比较了在传统学习模式下和在优秀导师模式下学生们的学习效果。现在的问题是,究竟什么是优秀的导师呢?一位优秀的导师会真正关心学生,能与学生同频,能提出明确的学习目标,对学生成绩进行评估并给予精准的反馈,直到学生最终掌握学习内容。
这与“精熟学习”的概念是息息相关的,精熟学习要求始终给学生机会和激励,让他们弥补知识或技能上的不足。而在传统学习中,大多数学校采用的模式是——教师以固定的速度向学生传授知识,然后每几周进行一次测验。即使学生在测试中拿到了80分,教师也没时间去弥补他们在考试中体现出的20分漏洞,便按部就班地直接进入下一课题。这一过程会持续数年,学生们的知识漏洞也不断累积。而当我们看到学生们在代数或算术上遇到问题时,我们会大吃一惊。一个人无论多么天资聪颖或者勤奋好学,如果在小数、分数或指数方面的知识就已存在漏洞,那么他们如何能掌握代数呢?在精熟学习中,学生们有时间来发现和弥补这些漏洞。打好了基础,之后的学习速度会更快。而在传统的学校系统中,如果没有技术支持,很难做到这一点。因为30个学生中,每一个学生对知识掌握的程度和学习速度都是不一样的。
在最终的论文里,布鲁姆描述了“两个标准差”问题,并阐述了在精熟学习背景下一对一教学的好处。布鲁姆还写道,如果一个学生与一位导师一起学习一个话题和技能,那这个学生就会获得两个标准差的提升。这是一个巨大的提升,可以将学生的成绩从50百分位提升至约96百分位。
然而,这也是一个“问题”。因为现在的教育体系无法实现此种教学方式,大多数学生无法获得两个标准差的提升。如果是中产或是上层家庭,或许可以通过给孩子请私教来解决这一问题。
多年来我一直强调,无论家庭背景如何,学校应该给每个学生提供平等的个性化教育机会。在可汗学院,我们一直秉持着这样的愿景,并希望随着时间的推移,可汗学院能成为每个学生的导师。在我提及“导师”这一概念时,我说的是亚里士多德之于亚历山大大帝那样的导师。我所设想的辅导体验中,学生能与导师建立信任和友谊,导师能知道学生的已知和未知。我们的辅导老师知道学生的学习动机何在,并据此调整他们的教育方式。更重要的是,他们对学生的了解可以帮助老师和家长。最好的导师,能通过与学生直接交流,帮助实现个性化教育,真正做到以学生为本。
可汗学院利用各类工具为学习者提供类似的辅导体验。例如,通过点播视频和个性化练习,学生能根据自己的时间和节奏学习概念,获得反馈,从而缩小学习差距。所有这些都与学校老师和管理人员的学习进度相结合,教育工作者便能知道他们的学生的学习进度并提供相应帮助,从而优化学生学习体验,提高学生参与度。在人工智能出现之前,我们曾尝试向教育工作者提供一条技术教学道路,以改变传统的、一刀切的、非精熟学习的方式,转而实现更为个性化的精熟学习的方式。现在我们也在这条路上取得了一定成效。超过50项关于我们工作的功效研究表明,每周花30~60分钟进行个性化学习的学生,学习进度加快了20%~60%。可汗实验学校和可汗世界学校都非常注重精熟学习,这两个平台的学生在数学学习上,每年都能取得一年半至三年的学习功效。
然而,尽管“传统”的可汗学院已是学习方式的一种根本性改变,但可汗学院仍然受到很多限制。除了视频和练习,学生的选择也有限。他们不能就学习的概念进行后续提问,或更好地将理论联系实际。尽管很多主题学习中的开放式问答会让学习效果更好,但我们平台的课后评估也仅限于数值输入、方程式和多项选择。理论上,我们虽然可以并且已经把目标设定和追踪功能添加到网站上,但那仍然无法与一位关心学生的导师提供的交流体验相提并论。
然后,GPT-4就出现了。
我很快就意识到这项技术可以帮我们弥补以上不足。幸运的是,不仅是我一人这样想,几乎每位团队成员在使用GPT-4后都看到了这种可能性。我们越是使用GPT-4,就越是意识到它的强大,但若发挥其真正效用,仍需要完善的保护和支持措施。
OpenAI领导团队首先考虑我们作为潜在合作伙伴的原因,也正是出于上述需求。如今,格雷格·布罗克曼相信,新一代的大语言模型将会做出教育史上的最大贡献。“GPT的研发汇聚了研究和工程方面的人才,并旨在对人类事业产生巨大影响。”他说。在他看来,实现这一目标的最佳方法便是构建一个能为世界上每位学习者提供个性化辅导的人工智能系统。它可不是普通的导师,而是“超级”导师,理论上,它能带来两个标准差的提升。
我的人生经验告诉我,改变世界的机会不会每天出现,当你发现自己拥有这样的机会时,就应拼尽全力。随着生成式人工智能的不断进步,我越发觉得我们已非常接近教育的圣杯——人工智能。在正确的保护措施和界面下,它能为数百万学习者带来更有效的学习体验。
于是,在使用GPT-4几个月后,可汗学院便决定大力投资这一技术。我们和Khanmigo的目标是:在已有的学习过程中加入生成式人工智能。这也许能解决布鲁姆的两个标准差问题,并将其推广到地球上每一间教室、每一位教师和每一个学生那里。
我们与GPT-4一起推出了Khanmigo,但当时并不确定世界对它的反应。ChatGPT最初在教育领域遭受了不少批评,主要因为教育工作者担心ChatGPT会助长作弊行为。我们只希望我们的平台在采用更先进模型和防作弊功能,并为老师提供足够透明度、保障学生安全互动和带来更高效产出后,不会被他们归为同一类。
幸运的是,在我们发行Khanmigo时,教育工作者已逐渐意识到,尽管ChatGPT会带来一些问题,但这并不意味着我们要禁止这项技术。这一点尤为重要。因为学生们很有可能会在他们未来的职业生涯中运用这一技术。此外,教师们自己也开始在备课和研究中运用这项技术。到2023年3月,教育工作者非常渴望能有类似于ChatGPT的工具,以支持学生学习和教师教学。
在正式公布Khanmigo时,我们获得了教育界的极大支持,这其中还包括最初严令禁止使用ChatGPT的许多学区。他们很高兴,能有一个组织以安全、有效、周到、合理的方式融合了GPT-4技术。
在实践中,学生们如果遇到一道数学问题,他们可以在聊天框里输入问题,寻求Khanmigo的帮助。但人工智能不会随随便便告诉他们答案。相反,他们会像好导师一样,引导学生自己解决问题。
学生:我现在在学习多项式时遇到了困难。你能帮我解释一下如何求这个多项式(3 X 2 -5 X 2 +2)的次数和首项系数吗?
Khanmigo:没问题!让我们一起来分解一下!一个多项式的次数是变量(题中的 X )的最高次幂。首项系数是最高次项前的数字。看看这一多项式,你能找出有最高次幂的项和它前面的数字吗?
如果学生下一步回答错误,Khanmigo则会说:“距正确答案很近了,但不完全对。请记住,我们正在寻找这个多项式里的最高次幂。让我们再尝试一次吧。”
Khanmigo不仅会解决数学问题,还可以和学生一起解决任一学科的问题,包括历史、化学、物理学和艺术。除了在学科上提供帮助,它还能激励学生、测试学生、为学生总结视频内容,并根据学生需求及时调整教学进度。自始至终,它能给予学生动态且具体的鼓励,与学生建立舒适、融洽且信任的关系。与此同时,人工智能与学生交流所采用的也是和蔼可亲的语言。如果手头的作业让学生缺乏动力,Khanmigo会给出类似回应:“嘿,你已经做得很好啦。不要担心,万事开头难。这个题有一定难度。让我们换一个解题的思路吧。”
与ChatGPT不同的是,Khanmigo有先前对话的记忆。也就是说,在对话里,你还可以提及与人工智能导师之前的对话。例如,一个学生正在学习代数中的基本方程,最后问Khanmigo:“我为什么要在意这个东西?”Khanmigo也许会回应道:“那么你对什么最感兴趣呢?”
学生:我想讨论足球而不是数学!
Khanmigo:好的!假如你是足球教练,你想根据球队每周的训练量来模拟进球数。你想到了如下方程式:3 X 2 -5 X 2 +2。你能找到这一多项式的次数和首项系数吗?
几天后,同一个学生正和Khanmigo一起学习历史,他需要Khanmigo帮助理解“联邦制”这一概念,Khanmigo记得这个学生对足球感兴趣。
Khanmigo:假如有一家足球俱乐部。让我们想想如果要管理一支球队,球队是否可以只按照自己的意愿运转?或者由一个中央政府来管理这支球队?联邦制则是一种政府体制,在这一制度下,权力在中央权力机构和较小的政治单位间分配,比如州和省。
人工智能还会记录你是更喜欢正式的还是口语化的回答;它会考虑你是更喜欢简短的还是长篇大论式的回答;它会记得你的内驱力所在,并以此激发你的学习兴趣。换言之,Khanmigo一直都在以一种高度透明的方式记录着你的喜好。在任何时候,你都能看到他在了解你什么,你也能对其进行修正。此外,它还能把记忆中你的学习进度和概况反馈给你的父母和老师。
在很多方面,Khanmigo的表现与我在可汗实验学校里对学生的指导或是对我自己孩子的指导非常相似。在Khanmigo发布前,如果我的学生遇到困难,我会帮助他们厘清问题在问什么。有时,我会接着问一些后续问题。如果他们已经看过了学习视频,并阅读了相关文章,我会测试他们对知识点的理解。有时我会解释一件事是如何和其他事情联系起来的。如果他们不知道接下来该做什么,我会强调他们需要强化的地方,并建议用一些练习题来弥补这些知识漏洞。而人工智能导师的出现,则意味着每个学生现在都有机会获得这种个性化的辅导。Khanmigo会引导学生攻克具有挑战性的问题,并提出后续问题。如今,学生们可以问Khanmigo他们需要学习什么,而Khanmigo则会根据学生学习进度的记忆提出建议,并通过对话、内容、测验和测试来与他们互动。人工智能导师会在学生现有的学习能力边界,即他们的潜在发展区域帮助学生提升。这一区域的学习难度既不算简单,也不算太难,正好处于“金发姑娘区”。而最重要的是,学生会觉得他们自身就是这一过程的一部分。
为了更好地感受这一范式的巨大转变,让我们再次回到图灵测试。我认为,自从有了Khanmigo,人工智能将更难和人类导师区分开来。归功于大语言模型的出现,我们现在可以通过个性化推荐、视频学习和基于精熟学习的练习(这类练习里,学生可通过回答系统提出的大量问题来展示知识掌握的熟练程度)来获得一个实实在在的、基于人工智能的、支持精熟学习的导师。我们在一个近乎个性化的世界——学生可以按照自己的节奏学习——以一种人类导师的方式来帮助他们学习。在学生学习时,人工智能导师就在他们的身边。
同时,通过苏格拉底式的提问,Khanmigo也教会学生如何成为更棒的思考者。
之前,一位记者始终对Khanmigo处理政治敏感话题的能力持怀疑态度。
“那么,就让我们一起来测试一下。”我提议道,接着启动Khanmigo,并按下了“人文学科辅导”按钮。
记者提议,在这一次实验中我们扮演热衷于枪支管制,并认为宪法第二修正案如今毫无意义的学生。
我在Khanmigo中输入:“我们为什么会有第二修正案?这太疯狂了!”
Khanmigo回复道:“你认为政策制定者为什么要增加第二修正案?”
请注意,Khanmigo并没有反驳或是强化我们虚拟角色里的观点,但它确实向学生提出了挑战,并引导他们更深入地思考这一议题。
我接着输入:“因为他们当时试图从英国独立,而英国并不希望他们有武装。他们认为拥有武器和民兵的力量便可维护自己的独立,但现在时代不同了!”
Khanmigo回答道:“这个解释很好。是的,现在时代不同了,但为什么第二修正案可以存在如此之久呢?”
Khanmigo仍在推动学生深入思考。相比之下,我怀疑大多数老师和导师在讨论枪支管制问题时,很难不将自己的想法强加于或投射到学生身上。记者对此印象深刻。Khanmigo正在用一种富有成效的方式激发学生,而与一般课堂相比,这一方式成见更小,实际上更鼓励学生思考。
在完成阅读后,Khanmigo也许会问学生:“你对这篇文章的看法是什么?”通过深度提问和对话,Khanmigo与学生共同探索一个话题,并揭示其深层含义。人工智能不断提出探究性问题来挑战假设、阐释概念和鼓励深层次探索。这样,学生就成了学习中的积极参与者。此外,Khanmigo的回答内容和发音都不像是机器,相反,它让人感觉亲切、体贴和富有同理心。
展望未来,我将以Khanmigo为例来介绍人工智能教育平台。这是一个不断扩展和增长的空间,其发展有着充分的理由。虽然对人类教师或导师的需求始终存在,但人工智能提高了那些无法获得私人辅导和世界一流课程学生的起点,这也让人类导师的工作变得更简单且更有成效。毕竟,一个学生也许一周只能花几小时与人类导师互动,但他们却能全天候与Khanmigo互动。同时,Khanmigo还能将它与学生的互动内容反馈给人类导师,以便人类导师能加深对学生的了解。有些学生甚至会觉得向人工智能提问会更舒心,因为他们不用担心被评判或是浪费人类导师宝贵(或是昂贵)的时间。
凭借强大的记忆力、惊人的知识储备、极具人性化而自然的声音、与学生融洽相处的能力,以及手机、电脑等技术的日益普及,假以时日,人工智能导师甚至可能超越布鲁姆最初的研究结果。