只站着眺望海面,你永远无法渡过海洋。
——泰戈尔
无论做什么,都不要让过去成为你的束缚。
——罗伯特·海因莱因,《严厉的月亮》
2023年元旦,11岁的女儿迪亚和我决定用一个下午的时间一起写一部短篇小说。当我把电脑放在厨房台面上时,迪亚已经确定了故事的框架并开始输入。我们故事的主角是一位时髦的网红,迪亚为她取名萨曼莎。故事中,萨曼莎被困在一座荒岛上。“太棒了。”我说,迪亚继续创作着她的故事。
这一刻,就像踏入了科幻小说的世界,又像跨入了实境游戏的虚拟空间,迪亚进一步完善着她所构想的主人公。不一会儿,萨曼莎直接回应了迪亚,她的话出现在屏幕上:“迪亚和萨尔曼,你们好,我是萨曼莎。你们创作的冒险故事相当精彩!你们打造了一个现代感十足的经典荒岛故事!”
迪亚继续写道:“荒岛上的生活如何呀?”
“岛上生活是一次意外的冒险,”萨曼莎回答,“我必须学会如何在舒适圈外生存,但我也发现了我从未意识到的潜能!”
“是什么样的才能呢?”迪亚问道。
萨曼莎回答:“首先,我已非常擅长用棕榈叶和树枝来建造临时避难所。我还学会了如何徒手抓鱼,以及只利用树枝和干树叶点火!”
迪亚毫不犹豫地输入:“为什么不用你的围巾来做一张吊床呢?”
“用我的围巾?那可不行!”萨曼莎回答,“这是一位设计师的杰作,我可不能贸然毁掉它。现在让我们继续吧,接下来会发生什么呢?”
“我认为我们应该按照萨曼莎说的做。”我说。
迪亚表示赞同。她回到电脑前,并输入:“如果突然间,萨曼莎最好的朋友艾米莉驾驶帆船来救萨曼莎呢?”
“太棒了!”萨曼莎写了接下来的一部分,“‘在看到她最好的朋友艾米莉驾着小小的帆船驶向小岛时,萨曼莎简直不敢相信自己的眼睛。她拼命地挥舞着双臂,试图吸引艾米莉的注意。随着帆船逐渐靠近岸边,萨曼莎越发激动。她迫不及待地想要告诉艾米莉岛上的冒险经历,并想知道艾米莉是如何找到她的。’好了,现在轮到你们了,迪亚和萨尔曼!完成接下来的两句话,让我们瞧瞧她们是如何重逢的。”
让我们简要回顾一下:11岁的女儿和我正与一个虚构的角色进行着一场真实的对话,这有点库尔特·冯内古特式的荒谬。我所熟知的世界突然向着陌生的新现实转变。
这对我们和地球上的每个人而言,都是一场深刻而永久的改变。
为了说明我们是如何实现这难以置信的一幕,让我们一起回溯。
20年前,我的表妹娜迪娅需要数学辅导。我是一位对冲基金分析师,又具有计算机科学的背景,于是我提议为她远程教学,方式是使用即时通信或电话交流。这种辅导方式似乎对她奏效。很快,家里人都知道我在远程辅导。于是在一年内,我辅导了十几个表亲。
为了更好地辅导他们,我开始编写基于网络的数学练习软件,这样他们就可以自行弥补自己的知识漏洞,并保持自己的学习节奏,同时我也可以追踪他们对内容的掌握情况。我给这个网站取了一个我唯一能想出的体面域名——可汗学院。意识到一对一教学的威力,我很快想到我该如何将这个平台规模化,让成千上万,甚至是数百万像我表亲一样的学生能受益于导师式的指导。
在朋友的建议下,我开始录制视频课,并将其发布于YouTube(油管)上,以配合软件使用。截至2009年,我的网站每月都有5万名学习者,每个人都渴望获得学业指导。我还发现很多用户都是学生,在他们看来,可汗学院是自己或家人无法负担的私教。如今,可汗学院是一个拥有超过250名员工的非营利组织,服务于全球50多种语言的1.5亿名学习者。支持世界级的大规模个性化学习(通常体现为一对一辅导),是我们免费为每位学习者提供世界级教育使命的核心。
我把可汗学院的愿景归纳为:成为世界上每一个学习者的导师。这也是我们一直以来努力的方向。而这不仅仅是规模化的私人辅导那么简单。很久以来,大量研究(或者说是我的直觉)表明,自步学习(自己设定学习节奏)和精熟学习(让每个学生真正精通一门学科)会让孩子们学到更多。而现实却是,一个班有30名学生,但为了学习进度,即使还有很多学生并未掌握已学知识,老师也会进入下一个知识点的讲解。显然,让每个学生都能随时随地得到专人辅导在经济上是不可行的。在此背景下,技术成为唯一可行的解决方案。在我看来,人工智能技术有朝一日可能会成为解决这个问题的关键,甚至能模拟真实教师。
我不是唯一拥有此梦想的人。科幻作家尼尔·斯蒂芬森在他的小说《钻石时代》中提到技术对教育的潜在影响。这本书设定在未来世界,并引入了AI的概念。小说中的《淑女养成指南》是一本先进的交互式图书,为它的年轻读者提供个性化教育。奥森·斯科特·卡德的小说《安德的游戏》设想了一所战斗学校。学校利用先进的人工智能技术——名字为“简”的人工智能教师——来测试和训练学生的战略思维和决策能力。艾萨克·阿西莫夫在短篇小说《他们的乐趣》中描述了未来学校使用先进技术革新教育体验,为学生提供个性化指导和机器人教师,实现个性化学习的场景。这类科幻小说也启发了现实的创新。在1984年《新闻周刊》的采访中,苹果公司联合创始人史蒂夫·乔布斯曾预言,计算机将成为我们思维的自行车。就像变速自行车会增强我们的体能一样,计算机将拓展我们能力、知识、创造力的边界。而多年来,我们也一直希望可以用计算机助力教育。
这些科幻故事的共同点在于它们都设想计算机最终能够实现我们眼中的智能。为了让此愿景成为现实,研究人员已经努力了60多年。1962年,跳棋大师罗伯特·尼雷利对战IBM 7094计算机并被击败。在此之前的1957年,心理学家弗兰克·罗森布拉特创造了第一个人工神经网络Perception,它是对神经元和突触集合的计算机模拟,经过训练便可执行特定任务。在早期人工智能出现这种创新之后的几十年间,我们拥有的计算能力只能处理像蚯蚓或昆虫大脑一样简单的系统。而我们也没有足够的技术和数据去训练这些网络。
随着时间的推移,人工智能技术已经取得了长足进步,并衍生出当今一些最常见的产品和应用。从电影流媒体的推荐引擎到如Siri和Alexa这样的语音助手,人工智能已十分擅长模仿人类行为,以至于我们经常无法区分人类和机器的回答。与此同时,计算能力发展到不仅能处理接近人脑复杂程度的系统,还在构建和训练神经网络上取得了重大突破。最新的技术突破来自谷歌在2017年推出的转换器(Transformer)技术,它能更快且更好地进行训练,从而更准确地将词语和想法联系起来。
这些系统能运作得多好通常与底层“模型”的复杂度和体系架构相关。我们将模型视作一种试图模仿或模拟真实世界的计算表征,比如,气象学家预测飓风路径时会使用天气模型,其中包含了数十亿或数万亿个大气中较小区域空间单元的软件模型,并预测较小区域空间单元将会如何互相作用。对大语言模型而言,它们是专为模拟词与词之间的关联而设计的。在大语言模型中,我们并不模拟大气情况,而是模拟神经元和突触。如以GPT-4(基于转换器Transformer的生成式预训练模型的简称)为代表的大语言模型,本质上是庞大且强大的“词汇智能体”,它们在书籍、文章、网站以及所有书面材料中进行了大量的信息训练。
通过分析和处理大量的文本,语言模型学习了词语、句子和段落组合在一起的模式、语言以及上下文。如果你向GPT-4之类的大语言模型提问,它会根据基于书籍、网页、视频文字稿和社交媒体发帖训练得到的模型来做出回答。语言模型虽缺乏人脑对真实世界的感官体验,但可通过接触超量语言(超过任何人一生中可阅读、观看或是听到的语言量)来弥补这一不足。
2022年夏天,我收到了来自格雷格·布罗克曼和山姆·奥特曼的一封邮件,他们分别是OpenAI的总裁和首席执行官。而OpenAI是一家致力于在社会友好型人工智能方向上进行突破性研究的实验室。OpenAI的这两位领导者希望能同我会面,并洽谈潜在的合作。我此刻尚未意识到,世界即将发生翻天覆地的变化。
当时,距OpenAI发行ChatGPT还有4个月的时间,距发布GPT-4还有7个月的时间,而他们想探讨的便是最终的推出计划。我十分好奇,却又不禁怀疑我们究竟可以合作什么。我并不认为新一代的生成式人工智能会契合我们的需求。尽管AI已经在写作领域取得了一些成就,但在我看来,人工智能并未真正掌握知识,且缺乏逻辑思考和推理的能力,也无法生成合理的事实。同时,我又十分钦佩OpenAI已取得的成绩,因此我们安排了会面的时间。
这些模型后续的每一代模型都会更加复杂,这可由每一代模型所含的参数量来衡量。对于参数,最佳理解便是将其视作一个数字,它描述了大语言模型中神经网络两个节点之间的连接强度。你也可以将参数视为大脑中两个神经元之间突触强度的表示。在2018年首次推出时,GPT-1就拥有超过1亿的参数量。仅在一年后,GPT-2的参数量就超过了10亿;GPT-3的参数量超过了1750亿,而GPT-4的参数量可能达到约1万亿。
OpenAI的领导层认为,GPT-4的性能将会惊艳四方,它在让很多人激动的同时也会让很多人不安。因此,他们希望能与少数值得信赖的合作伙伴一起推出GPT-4,而这些合作伙伴也能展示出积极而真实的案例,可汗学院便是他们的首选。他们联系我的第二个原因是想让我们帮助评估他们的新产品。他们需要展现出GPT-4具有逻辑推理、辩证思考和实际处理知识的能力。OpenAI团队想了解GPT-4在大学层面生物学问题上的表现,而我们正好有成千上万个这样的问题。
我突然十分激动,因为我将是在这个星球上首批见证GPT-4能力的人。根据以往的经验,我明白探索一项技术最好的时机便是它正在走向完善的时候。如果你在大多数人仍认为它是一个玩具或是消遣时对其进行投资和测试,那么在它进入全盛时期时,你将会收获颇丰。视频学习的起步阶段便是这样,在一大群反对者说这不过是消磨时光时,先驱们早已告诉我们点播视频不只是猫弹钢琴那么简单。事实是,你可以利用它们来帮助学习。
如今,学生会用点播视频来学习他们想知道的一切,这种方法也在课堂上被逐步接受。可汗学院在这方面发挥了引领作用,因为我们用视频帮助了全球数亿学习者。我们同时还表明,视频不是教师的替代品,而是课堂的一部分,并能为个性化学习、实践以及课堂交流腾出更多时间。而这毫无疑问让教师更为重要。现在是时候看看生成式人工智能是否也能完成同样的事——辅助学生,并让教师发挥更大的作用。
山姆和格雷格开始了GPT-4的演示,他们向我展示了从大学理事会网站上找到的一道应用生物学选择题。他们问我答案是什么,在读完题目后,我认为答案是C。接着,他们通过一个聊天窗口(类似于大家现在习惯使用的ChatGPT的聊天窗口)让GPT-4回答。不一会儿,GPT-4给出了正确答案。
我没有立刻说话,但不禁浑身起了一层鸡皮疙瘩,甚至我还持有几分怀疑。“等一下,”我说,“这个人工智能已经能回答应用水平的生物学问题了?”也许它只是走运,我想。“你能让它解释如何得出答案的吗?”
格雷格接着输入:请解释你是如何得出答案的。没几秒,GPT-4就给出了一个清晰、简洁且缜密的解释。不仅如此,它的回答十分流畅,就像真人在回答。
此时此刻,我不再掩饰我的惊讶。
“能问一下它为什么其他选项不正确吗?”
格雷格答应了,不一会儿,GPT-4便分析了为什么其他选项是错误的。
接下来,我问格雷格GPT-4能否出一道应用生物学原创问题。
GPT-4不仅做到了,甚至给出了10多道题目。
两个月后,我拜访了比尔·盖茨,并向他介绍了可汗学院的近况。我从他那里了解到为何OpenAI团队会向我展示一道应用生物学题目。比尔告诉我,他在第一次使用GPT-3时就感到震惊,但他告诉OpenAI团队,只有当GPT能通过应用生物学考试时,他才会真正为其折服。OpenAI团队为我做的第一次演示,GPT-4现在已经完全能做到。
我对格雷格和山姆说:“它将改变一切。”我脑海里充满着GPT-4能重塑我们的教育、证书、工作和潜力的方式。
“我们也是这样想的,”山姆说,“目前,GPT-4还不够完美,但技术已经日臻完善。谁知道呢,如果我们设想正确,教育工作者也许会使用这一技术。”
我们不久前认为只存在于《星际迷航》里的技术突然成为现实,而最伟大科幻小说家所设想的创新也已成真。
1940年代初期,杰出数学家克劳德·香农提出了一系列重要理论,其中之一是他构建的电子通信理论,它也在后来成为数字技术的基础。1948年,在贝尔实验室工作期间,香农开始涉足我们如今所知的人工智能领域。香农决定探究算法可以如何向语言靠拢。他在《贝尔系统技术期刊》发表了一篇名为《通信的数学理论》的论文。彼时互联网尚未出现,数字计算机正处于发展的早期阶段。香农的信息论证明了一系列的概率过程可以让算法更加近似英语语言。通过记录文本中的词频,他设计出了一个算法,该算法可以预测出下一个最有可能出现的词。最终,这一小型语言模型能生成一个完整的句子。随着该过程的不断改善,生成的句子也更加自然。这一过程似乎过于简化了,但实质上,类似于GPT-3和GPT-4的语言模型本质上是基于专业化神经网络训练的复杂大型语言模型,而这一基本思想也可以追溯至香农的早期工作。
继香农的贡献后,我们见证了计算机领域另一位伟人的出现,他就是艾伦·图灵。图灵除了破译德国密码,帮助我们战胜纳粹,还进一步探索了人工智能的概念,以及机器能否达到逼真模仿人类智能的境界。1950年,他撰写了一篇名为《计算机器与智能》的基础性文章,其中,他介绍了模仿游戏的概念,也就是如今的图灵测试。设想你正在电脑或手机上聊天,无法看到正与你交谈的人,你将如何判断你是在与人类还是与机器聊天呢?这就是图灵测试的实质。测试中,通常会有一位裁判来评估人类和机器的回答。机器的目标便是让裁判认为它是人类。它需要展示出智慧、理解力以及像人一样连贯对话的能力。图灵认为,如果一台机器能持续骗过裁判,我们就可以说它具有智能。换言之,如果机器能通过图灵测试,那就意味着它具有近似于人类的智能。
在2022年夏天接受山姆和格雷格邀请进行新GPT-4实地测试时,我想知道它有多大可能通过图灵测试。1990年代中期,我曾在麻省理工学院学习人工智能。那时,有些简单的程序能在一些对话里欺骗人类,但没有一个程序能在长时间频繁的对话中让人觉得像在与人交流。即使在遥远的未来有一台机器能真正通过图灵测试都让人难以置信,更不用说在我有生之年就有机器能做到,而能亲身尝试一项接近实现或已经实现的技术,让我激动不已。这一技术进步不亚于科学家实现冷核聚变或是超光速旅行。
最初的兴奋劲儿过后,我不禁思考起智能技术可能会造成的社会影响。尽管能解决许多问题,但人工智能也有可能带来一些潜在的负面影响。如果大语言模型能够帮助辅导学生,那么它也能帮学生写论文。是否会带来如此结果:新版本的GPT成为学生的依赖,却阻碍学生提升自身的研究能力和写作水平?我还意识到,如果GPT-4能协助人们沟通、解决问题,那么它也有可能会反过来对人类产生威胁,比如扰乱工作、削弱目标意识。一个能成为优秀导师的人工智能技术,也有可能成为被有心之人用来欺诈或者洗脑的技术。
我脑海中还在持续构想着各类黑暗的情景和后果——从我们孩子身上获取数据到潜在的技术成瘾。人工智能的颠覆性意味着我们需要认真对待,除了OpenAI,还有数个组织在大语言模型上投入大量资金,包括微软、谷歌和Meta(元宇宙),很多国家更是举全国之力投入其中。所有这些科技巨头多年来都在使用某种人工智能,为我们推送无时无刻不在接触的广告、视频、搜索结果和社交媒体帖文。但我这次接触的人工智能似乎与众不同——它也的确如此。
科幻小说家一直都在区分两类人工智能:一类是专业化人工智能,它可以帮助优化某一特定任务;另一类是通用人工智能,它可以像人类一样处理多个任务;而后者则有可能导致乌托邦和反乌托邦的未来。对很多人而言,像GPT-4这样的大语言模型更近似于通用人工智能,因为它们可以在任何主题下进行写作和推理,使其在任何领域都具有相关性。生成式人工智能还可以生成和理解图案。尽管知道人工智能正以我们难以想象的方式改变着世界,但我也意识到,是否继续推进这项技术并不由我或者可汗学院来决定,这项技术早已在不断精进。作为一个致力于善用技术的人,我思考着能否利用生成式人工智能来实现利益最大化,并让教育更加接近乌托邦式的情景。
那是一个周五,我意外获得了使用OpenAI最新模型的权限。接下来的一整个下午,我都坐在电脑前,甚至一整个周末,我都为之深深吸引。在电脑前整整坐了10小时后,我试着关机并休息,但我的思绪都被这一技术占据,我思索着作为教育者的我们该如何和我们的学生一起使用它。GPT-4具有深远的影响力,它不仅可以解决和解答复杂且棘手的问题,还可以解释自己的推理过程,并生成新的问题。除此之外,它还可以进行角色扮演。在给出GPT-4指示词后,我让它充当数学老师、科学老师和语言老师的角色,每一角色都能与学生进行对话。
而GPT-4能用不同语气和风格写作,这一点真正引起了我的注意。比如,在我使用GPT-4时,我忍不住想要它以特朗普的语气重写一遍《独立宣言》:
伙计们,让我告诉你们,是时候宣布我们要脱离这个失败的政府和糟糕的领导者乔治三世了。我说,这家伙完全就是灾难。他一直在剥夺我们的权利,无视人民的意志,只顾塞满自己的钱包,而不是帮助民众。这实在是太、太、太悲伤了。
但我们,我们广大民众不会再继续容忍了。我们要建立自己的国家,它将成为世界上有史以来最棒的国家。相信我,没有人比我更懂如何让一个国家更伟大。我们将拥有最发达的经济、最强大的军队、所有最好的东西,一切都会变得非常强大。
接着,我让ChatGPT用苏斯博士的风格来写《独立宣言》:
在这自由之地、勇敢之乡,
一个新的国家诞生了。
我们不再是大洋彼岸国王统治下的奴隶。
我们宣告独立,欢呼雀跃,
以手中之笔和心中之激情,
写下我们的不满,
这大地上的每一处,
不再有无代表权的税收,
不再有士兵入侵我们的家园,也不再有沮丧。
我们坚信这些真理,
那便是人生而平等,是的,你我皆平等。
我们的权利不可剥夺,
生命、自由、幸福,我们将永存于世。
一旦人们都能使用ChatGPT,这样有趣的例子将变得比比皆是,但当时,我是第一批使用这一技术并尝试这种提示的人。而GPT-4诚然比GPT-1更强大,但它还要等几个月才会向大众公开。我发现,基于我的提示词,GPT-4的回答不仅惊艳、有趣,甚至让人细思极恐。在我向它提问或是求推荐时,它给出的回答让人感觉非常真实。然而,既没有真正的人在幕后作答,也没有其他算法常用的类似“如果……那么……”的逻辑来生成文本。我得到的回答既不模式化也不机械化。与之相反,就算每次提出同样的问题,我也会得到不同的回答,这些回答是基于我与它对话的上下文得出的。
此外,我还认识到这项技术可能改变我们对K-12、高等教育和其他领域的看法。尽管人工智能尚不完美,有时会在数学方面出错,但在我更加熟练使用提示词后,GPT-4的表现也越来越好。在周末快结束时,我不禁想到,如果把科技领域和教育领域最聪明的专家召集起来,与我共同探索这个平台,将会发生什么。于是,OpenAI同意授权给另外30位工程师、内容创作者、教育家和研究者,用于GPT-4的实验。
现在正是黑客马拉松的时间。
在可汗学院,团队成员每六个月会有一周时间可以做和组织使命相关的任何工作。有一周,我向团队的一小部分成员演示了GPT-4,并让他们自由发挥。通过合作创新,我们进行了头脑风暴,进而设计和产出了非常酷且有重要意义的想法。最终我们把这一次活动称为“AI黑客马拉松”,这一次马拉松产出了很多全新概念和教育模式。例如,如果人工智能能帮助老师写教学计划会发生什么呢?如果人工智能能与学生进行辩论呢?如果它能创建项目呢?如果它能帮学生减少压力并启发学生产生新想法呢?如果这一技术能够用于学生自测和温习呢?教育工作者能使用人工智能设计出学生能够完成的新颖的活动。人工智能还能帮学生写论文,并通过不断反馈,让学生更好地完成论文。
由此,AI黑客马拉松的参与者们探究了关于安全、保护和偏见的话题(请注意,这是远在OpenAI正式向大众发布ChatGPT之前)。我们也提出了一些明确的担忧:让学生使用生成式人工智能去写论文、做研究、完成测试,甚至帮他们申请大学是好事吗?我们担忧人工智能也许会把我们的孩子变成不学无术的骗子。如果人工智能能接管学习,那曾经辅导孩子作业的家长将会丧失与孩子建立感情的机会。对老师而言,这会是好事,还是会影响他们的教学能力呢?我从不认为人工智能会让老师失业,而最好的情况便是它能提升老师的教学能力。但我也担心,人工智能会削弱人的批判性思维。
20年前,我就在教育点播视频出现时见过同样的担忧:视频会不会让学生分心?视频会不会缩短学生注意力的时间?它会不会让师生关系变得更加疏远?学生如何知道什么内容适合观看?如果在某一学科遇到困难或疑惑,学生应该向谁求助呢?
但决不能让恐惧阻止我们的探索。在对GPT-4进行更多测试的过程中,我们也知道了更多解决办法,这些办法能让它的优势更加突出。为了解决不诚信的问题,我们认为可以设计一位拒绝直接给出答案的人工智能导师。就像一位称职的人类导师一样,它也能提出引导性的问题。在考虑安全时,我们认为可以创立一个对家长和老师透明的系统,在系统中可以记录学生与人工智能的所有对话。为了鼓励人与人之间的互动,我们建议设计出师生皆可使用的工具,这些工具可以为他们节省时间和精力。
在AI黑客马拉松结束时,我们团队更加确信,GPT-4将会成为教育领域的游戏规则改变者。只要使用得当,它将会影响教师们制订计划、开展教学和评分的方式。将人工智能引入教室,教育工作者也许能解决在教育领域里根深蒂固的一些问题,而这些问题用现有的资源和技术是无法攻克的。不久后,学生们也许就能学得更快,记忆的内容也会更多,这证明了人工智能是增强人类智慧、挖掘人类潜力的终极学习工具。人工智能还可能加速全球学习进程,并让我们更接近实现共筑美好世界的目标。在那个世界中,世界一流课程的学习对每个人来说都是可负担的。人工智能还革新了我们交流、创造以及获取信息的方式,而这些在20多年前是由个人电脑完成的,在40多年前是由计算器完成的。
对我而言,这无疑是鼓舞人心的。我也越发坚信,只要谨慎从事,我们就能减轻生成式人工智能带来的风险和一些潜在问题。虽然我们是目前地球上第一批使用这项技术的人,但显然只要地球人知道了这项技术,所有事情都会发生彻底改变——并且不是几代人的时间,而是数月间。
2022年底,就在AI黑客马拉松开展两个月后,我们仍在不断探索这项技术的各种可能性,在那时,OpenAI向大众发行了ChatGPT。最初发布的版本在已发布数月的GPT-3.5中嵌入了聊天窗口。尽管GPT-3.5不是最优版本,因为它以一个远不及GPT-4的模型运转,但一经发布,还是立即吸引了全世界的注意。短短几天内,已经有数百万人使用它,社交媒体和新闻媒介似乎对ChatGPT以外的话题不再感兴趣。
在第一波兴奋潮中也不乏担忧。很多人担心这会造成学生不诚信行为的大流行,人工智能会生成事实错误、幻觉、偏见,并质疑ChatGPT获取数据来源的可靠性。我们看到社会正与这个强大但并不完美的工具做斗争,尤其是在教育领域。在ChatGPT发行的数周内,各地的学校都在禁用这一技术。这便点燃了我们可汗学院的斗志,我们不仅想证明面对潜在风险有许多解决方法,同时想证明人工智能将成为教育领域的变革性力量。我们想让真实工具在真实学校里实地应用,而不仅仅停留在理论层面。
OpenAI计划在数月内发布GPT-4,一旦发布,我们便需要回答如何解决不诚信、透明性以及审核机制等问题;我们需证明,人工智能对于真实教育环境的学习者和教师也有非常重要的价值,因为它能帮助教师写教学计划、监控课堂进度、做出及时反馈,甚至缓解教师的压力;我们还需要证明人工智能之于学生的价值是充当他们苏格拉底式的导师、辩论伙伴、指导顾问、生涯规划师,并且是他们取得更好学业成绩的驱动力。因此,与OpenAI一起,我们创建了一个快速原型构建团队,用于开发一个人工智能与教育融合的平台,并称之为Khanmigo。
在推动其创新性能力应用和建立安全保障两大目标的驱动下,我有了一些想法:所有人都在说学生借助人工智能写论文会导致学术诚信问题,但如果它不是代劳学生的论文写作,而是和学生一起完成论文呢?
这就是我在2023年元旦的新发现,于是我请我的女儿迪亚用GPT-4和我一起来写故事。这不是我第一次请迪亚参与教育实验,或者帮我们测试一个产品原型。通常来说,这一类的非正式测试,我会邀请女儿、儿子以及另一位非常有耐心且来自可汗实验学校或可汗世界学校的学生或老师参加。他们会进行新的探索,以确保学生和技术之间的界面能够合理运行。我常发现这种自己动手式的用户调研非常有用,且令人信服。我的合作者们也喜欢这种方式,因为这一方式可以让他们反复检验一个会对学习者产生影响的新程序或是新创意。对GPT-4来说,这一点再真实不过了。因此,我为GPT-4创造了一个提示词,告诉它和我们一起写故事,而非替我们写故事。我还告诉了它我们理想的交流方式和说话语气。
迪亚接着开始创作关于萨曼莎的故事。萨曼莎是一位网红,被困在荒岛上,后来被她最好的朋友艾米莉解救。迪亚写了一段,大语言模型便负责写下一小段。萨曼莎向我们介绍她自己,讲述了她的日常生活,并与我们共同创作这一故事。令我们惊叹的是,通过GPT-4,萨曼莎把这次冒险经历变得绘声绘色,引人入胜,对话趣味十足,完美契合迪亚创作的两个人物的特征。迪亚和人工智能继续一起写作,她们的故事从萨曼莎对她高档定制服装的担忧到艾米莉生病离世的动人时分,充满了暖心、欢笑以及悲伤的时刻。
在交流的全过程中,人工智能证明了自己有进行有意义且复杂对话的能力。它以自然且真实的方式回应着迪亚的指令。作为父母,看到女儿与GPT-4交流,并以全新的方式激发出她的想象力,这无疑是振奋人心的。她所使用的人工智能精准捕捉到了迪亚所构建的虚拟世界,并不断追踪她与角色之间的对话。人工智能正开阔着她的眼界,帮助她提升写作能力和创造力。写作通常情况下是单向活动,创造者将自己的想法倾注在纸张上,并选择恰当的措辞和语气,而这一单向任务,现在已变成人机间的双向交互。这也让我11岁的女儿成为世界上第一个在创作中能与故事对话并得到回应的人!
我们正使用这项技术,它将我们所知的所有教学和学习都提升到了一个新境界,这无疑是激动人心的。我突然意识到,我需要将这项技术带给世界上每一个学习者。我们未来教学的方式正在我眼前发生着改变。在女儿和萨曼莎一起忙于她们的故事创作时,多亏了人工智能,我们才能谱写教育的新篇章。因此,面对新变化,我们应当谨慎应对,而非惧怕改变。
如今,世界已逐步意识到大语言模型对于教育工作的无限可能。想要利用好这一技术,我们需要一定的创造力及勇气。当然不是盲目的勇气,而是我们所谓的创新教育的勇气。这一勇气的本质是在科技迅猛发展时承认自身的恐惧,但告诉自己它同时也会带来机遇与挑战。
为了最大限度地了解这项技术,我们需要重新审视所有可能发生的事情。我们需要重新思考如何减少风险、恐惧以及犹豫。这意味重新评估一切,从教师的作用,到孩子们如何使用多媒体,到人们如何获得证书,到如何帮助毕业生顺利就业。
我们正处于教育发展的重要转折点,它正改变并将持续改变我们对于学习、工作以及人类使命等所有问题的看法。