购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

ChatGPT现象

ChatGPT是人类第一个通过图灵测试的智能体

1981年8月12日,IBM公司推出了世界第一台采用了开放性架构的个人计算机PC 5150。1982年12月,这款PC登上了《时代》周刊的封面,并被评选为“年度人物”。约40年后,2022年11月30日,OpenAI正式发布了有史以来用户增长最快的消费级AI应用程序ChatGPT。2023年2月,ChatGPT也以“年度风云人物”的身份,出现在《时代》周刊的封面上。对此,我的感觉是,在AI发展历程中,一座新的丰碑出现了。

作为AI大模型强大能力的一种载体,ChatGPT可以说是将复杂技术简化为无门槛产品,进而为大众所广泛接受的标杆之作。大模型的研发与迭代已有好几年,2020年GPT-3的诞生首度引发了全球级的破圈关注。尽管该模型被更多地提供给专业人士使用,但科技界内外确实也因这款明星产品而备受震撼。

2022年的岁末时分,ChatGPT一出场,就已经是一款能力较GPT-3更全面与强大的AI应用。ChatGPT在GPT-3.5的基础上经过了特别的优化与微调,更适合与人类进行自然语言对话。ChatGPT一经推出,我就注册了账号,简单体验了一番。我的第一感觉是这个机器人做得太好了,虽然也会屡屡出现幻觉(Hallucination)等问题,但很明显,ChatGPT的语言能力极其出色。今天,这款AI应用的背后已是GPT-4o、OpenAI,与最初的版本相比,又有了明显的进步。

事实上,从GPT-3到GPT-3.5,中间经历了约两年的“漫长”时间,算法本身自然有很多改进。例如,InstructGPT(人工智能语言模型)和利用人类反馈来强化学习,都在很大程度上让AI得以更好地判断用户意图,进而给出更准确的答案。

但对我来说,ChatGPT带来的更大震撼是,它竟如此受欢迎——它在诞生两个月后,就成为历史上最快突破1亿用户的科技应用,简直像是科技界的泰勒·斯威夫特。在ChatGPT面世前的两年,生成式AI可谓进展最快的技术,比如在AI做图的赛道,就有DALL-E(美国图像生成系统)、Midjourney、Stable Diffusion(两者均为AI绘画工具)等“种子选手”在你追我赶。AIR团队也在研究生成式AI技术,例如,自动驾驶的仿真模拟就需要用到这一技术。总体来说,这个领域发展迅速,但似乎还谈不上技术质变与体验跃升。

然而,ChatGPT确实是一次质变与跃升,是AI概念诞生至今六十余年的一座里程碑。事实上,若是以麻省理工学院(MIT)的计算机科学家约瑟夫·维森鲍姆于1966年开发的聊天机器人程序Eliza(伊丽莎)为开端,计算机科学家对于人机对话的探索已进行半个多世纪。总体而言,进步很大,但一直未能出现实质性的飞跃。在ChatGPT发布前,聊天机器人主要应用于聊天、客服等垂直领域,整体感觉更像是简单的工具或无聊时的玩具,常常答非所问,被用户戏称为“人工智障”,这类聊天机器人前辈想要通过图灵测试,显然难如登天。ChatGPT则是第一个可以通过图灵测试的智能体,我在它的身上看到了通用人工智能的雏形。

2016年,AlphaGo在围棋领域表现出的统治力首次将AI的可怕潜能展示于世人面前。当时,无论是人脸识别技术还是语音识别与合成技术都已相当成熟,但能够将AI的诸多能力整合到一个应用、一个界面的明星产品暂未出现,因此许多人对AI的印象依然比较刻板,觉得AI能做的事情不多。自动驾驶给人的感觉非常酷,但它是牵一发而动全身的火种般的项目,因而其实用化推进始终比较慢,直到今天也未变成为亿万国民所普遍认可的主流新业态。对于那时就已经开始集成AI成果的应用率较高的搜索,用户的体会也并不深刻。

总之,在2016年那个时间节点,大多数普通人感受不到AI给生活带来了什么改变。直到6年后,ChatGPT横空出世,尝鲜者惊喜地发现,可以直接与AI展开有价值的对话了。屏幕对面回应你问题的那个家伙就像一个万事通,什么都知道。通常情况下,它不会像那些自诩智能的前辈那样,给出与提问意图南辕北辙的回答,更不会自作聪明地绕开问题、生硬地将话题转向不相干的方向……虽然ChatGPT偶尔也会发神经、说胡话,有时还说废话和囫囵话,但人不也会这样吗?而且,它在很多方面做得比普通人要好,比如,能写出顺畅的文案,语法挑不出毛病,还能帮助用户写程序、规划任务,等等。其表现足以证明,在认知层面,AI的性能实现了空前的提升,甚至让人看到了通用人工智能的影子。

全世界的计算机科研工作者都在探索,哪条技术路线通往真正的通用人工智能。GPT-3的诞生,让不少人意识到,大数据和超大模型可能是一个正确的方向;而后继者ChatGPT和GPT-4的不俗表现,让大家对这条路线的信心更加坚定。规模效应极其重要,特别是上下文学习/情境学习(In-context Learning)等学习方式,使模型能够越来越快地适应新的任务。当用于训练AI的数据规模不大时,效果还不明显;但规模达到一定程度后,就可能产生一些超出设计者预期的现象或能力,涌现得以发生——就像一堆沙子里突然有一座沙堡拔地而起。

前文提到的梅特卡夫定律,同样适用于大模型的规模效应。顺便一提,罗伯特·梅特卡夫先生于2022年获得了图灵奖。获奖原因是他对以太网的发明、标准化、商业化乃至对整个互联网的贡献。

生成式AI是大模型时代的操作系统

在我看来,GPT系列可以看作一个由大模型组成的AI操作系统。它与PC平台的Windows、MacOS、Linux,以及移动平台的iOS、Android具有相似的意义。

一个新的操作系统意味着什么?它意味着下层的硬件、上层的应用都将被重新构建、塑造,进而形成全新的生态系统。如果PC互联网的生态价值是1X,移动互联网的生态价值至少是10X,那么AI的生态价值或许在100X以上。

PC时代的统治者是“Wintel联盟”,即以英特尔x86处理器为核心的硬件生态,搭配以微软Windows操作系统为核心的软件及服务生态。

到了移动时代,从智能手机、平板电脑到VR(虚拟现实)装备、AR(增强现实)装备、智能腕表,绝大多数硬件都以ARM架构(一种基于精简指令集计算机的处理器架构)的处理器为核心;操作系统则以iOS和Android两大阵营为主。这一阶段还出现了影响力堪与操作系统相媲美的“超级应用”,如微信、抖音等。

大模型时代又会怎样?我们看到并行计算能力超强、更适宜处理计算密集型任务的GPU的重要性凸显。同时,神经网络处理器(Neural-network Processing Unit,NPU)、现场可编程门阵列、专用集成电路推动着计算硬件系统的进化;操作系统则可以是AI大模型本身,称为GPT-x或基础模型(Foundation Model,FM)。

在AI能力尚未发展到今天这一阶段时,便已出现了很多算法、模型、框架等。现在有了基础模型,全世界的企业和开发者都可以基于此做各种各样的应用开发:大模型之上还可以有小模型和不同的插件,整合现有的App,发展新的功能,吸引新的用户。当前,微软公司在这方面就表现出色,从Azure到Windows,从Microsoft 365到Bing搜索引擎,微软已将AI大模型的能力灌注至其全线产品中。

就像是科技版的“魔戒”,当ChatGPT及其后继者被越来越多的用户使用,待它们真正融入人们工作与生活的方方面面时,无论是日活跃用户、月活跃用户、用户使用时长,还是留存率、用户交互度,都将全面超越手机和PC等硬件、社交工具和热门游戏等软件。届时AI将成为每个人与每一台机器交互的界面,而用户不再需要对处理器、算力、存储给予过度的、不必要的关心,他们更在意的将是模型能够提供什么样的功能。对于许多从事云计算服务的公司来说,这也是重塑云的时刻。 QEZGWg2aJL6eWA+PHdL070yp6yxwz7KUecHJDO43a4siugDk0T8OarKMCbloBQ8U

点击中间区域
呼出菜单
上一章
目录
下一章
×