可以说,有着通用人工智能雏形的ChatGPT,所获得的成功更是一种工程上的成功,ChatGPT证明了大模型路线的胜利,在ChatGPT之后诞生的性能更强悍的GPT-4、能够直接文生视频的Sora都延续了大模型的技术路线——让人工智能完成了从0到1的突破,走向真正的通用人工智能时代。
基于AI能力的不同,我们可以把AI大致归为三类,分别是狭义AI(Artificial Narrow Intelligence,ANI)、通用AI(Artificial General Intelligence,AGI)和超级AI(Artificial Super-intelligence,ASI)。
到目前为止,我们所接触的AI产品大都还是ANI的。简单来说,ANI就是一种被编程来执行单一任务的人工智能——无论是下棋,还是分析原始数据以撰写新闻报道。ANI也就是所谓的弱人工智能。值得一提的是,虽然有的人工智能产品能够在国际围棋比赛中击败世界围棋冠军,如AlphaGo,但这是它唯一能做的事情,如果你要求AlphaGo找出在硬盘上存储数据的更好方法,它就会茫然无措。
我们的手机就是一个小型ANI“工厂”。当我们使用地图应用程序导航、查看天气、与Siri交谈或进行许多其他日常活动时,我们都在使用ANI。
我们常用的电子邮件垃圾过滤器是一种经典的ANI工具,它拥有加载关于如何判断什么是垃圾邮件、什么不是垃圾邮件的智能,然后可以随着我们的特定偏好获得经验,帮我们过滤掉垃圾邮件。
在我们的网购背后,也有ANI的工作。比如,当你在电商网站上搜索产品,然后却在另一个网站上看到它是“为你推荐”的产品时,会觉得毛骨悚然。而逻辑就是一个个ANI系统网络,它们共同工作,相互告知你是谁,你喜欢什么,然后使用这些信息来决定向你展示什么。一些电商平台常常在主页显示“买了这个的人也买了……”,这也是一个ANI系统,它从数百万名顾客的行为中收集信息,并综合这些信息,巧妙地向你推销,这样你就会买更多的东西。
ANI就像计算机发展的初期,人们最早设计电子计算机是为了代替人类计算者完成特定的任务。而艾伦·图灵等数学家则认为,我们应该制造通用计算机,可以对其编程,从而让它完成不同的任务。于是,曾经在一段过渡时期,人们制造了各种各样的计算机,包括为特定任务设计的计算机、模拟计算机、只能通过改变线路来改变用途的计算机,还有一些使用十进制而非二进制工作的计算机。现在,几乎所有的计算机都满足图灵设想的通用形式,我们称其为“通用图灵机”。
市场的力量决定了通用计算机才是正确的发展方向。如今,即便使用定制化的解决方案,如专用芯片,可以更快、更节能地完成特定任务,但更多时候,人们还是更喜欢使用低成本、便捷的通用计算机。
这也是今天AI即将出现的类似的转变——人们希望AGI能够实现,其能够对几乎所有的东西进行学习,并且可以执行多项任务。
与ANI只能执行单一任务不同,AGI是指在不特定编码知识与应用区域的情况下,应对多种甚至泛化问题的人工智能技术。虽然从直觉上看,ANI与AGI是同一类的,都只是一种不太成熟和复杂的实现,但事实并非如此。AGI将拥有推理、计划、解决问题、抽象思考、理解复杂思想、快速学习和从经验中学习的能力,能够像人类一样轻松地完成所有这些事情。
当然,AGI并非全知全能。与任何其他智能存在一样,根据所要解决的问题,其需要学习不同的知识内容。比如,负责寻找致癌基因的AI算法不需要识别面部的能力;而当同一个算法被要求在一大群人中找出十几张脸时,它就不需要了解任何有关基因的知识。AGI的实现仅仅意味着单个算法可以做多件事情,而并不意味着它可以同时做所有的事情。
但ASI又与AGI不同。ASI不仅要具备人类的某些能力,还要有知觉,有自我意识,可以独立思考并解决问题。虽然两个概念似乎都对应着人工智能解决问题的能力,但AGI更像是无所不能的计算机,ASI则超越了技术的属性成为类似“穿着钢铁侠战甲的人类”。牛津大学哲学家和领先的人工智能思想家尼克·博斯特罗姆就将ASI定义为“一种几乎在所有领域都比最优秀的人类更聪明的智能,包括科学创造力、一般智慧和社交技能”。
自人工智能诞生以来,科学家们就在努力实现AGI,具体可以分为两条路径。
第一条路径就是让计算机在某些具体任务上超过人类,如下围棋、检测医学图像中的癌细胞。如果计算机在执行一些困难任务时的表现能够超过人类,那么计算机最终就有可能在所有的任务中都超越人类。通过这种方式来实现AGI,AI系统的工作原理以及计算机是否灵活就无关紧要了。
唯一重要的是,这样的人工智能计算机在执行特定任务时比人工智能计算机更强大,并最终超越人类。如果最强的计算机围棋棋手在世界上仅仅位列第二名,那么它也不会登上媒体头条,甚至可能被视为失败者。但是,计算机围棋棋手击败世界顶尖的人类棋手就会被视为一个重要的进步。
第二条路径是重点关注AI的灵活性。通过这种方式,人工智能就不必具备比人类更强的性能。科学家的目标就变成了创造可以做各种事情并且可以将从某个任务中学到的东西应用于另一个任务的机器。
之所以说ChatGPT打开了AGI的大门,正是因为ChatGPT具备了前所未有的灵活性。虽然ChatGPT的定位是一款聊天工具,但不同于过去那些智能语音助手,除聊天外,ChatGPT还可以用来创作故事、撰写新闻、写代码和查找代码问题等。
事实上,按照是否能够执行多项任务的标准来看,ChatGPT已经具备了AGI的特性——ChatGPT被训练来回答各种类型的问题,能够适用于多种应用场景,可以同时完成多个任务,其性能在开放领域已经达到了不输于人类的水平,在很多任务上甚至超过了针对特定任务单独设计的模型。这意味着它可以更像一个通用的任务助理,能够和不同行业结合,衍生出很多的应用场景。
可以说,ChatGPT已经不是传统意义上的聊天工具,而是呈现出以自然语言为交互方式的AGI的雏形,是走向AGI的一块可靠的基石。而在ChatGPT之后相继诞生的更强大的GPT版本和具有极强的多模态能力的Sora,更是通往AGI时代的重要突破。
不仅如此,OpenAI还开放了ChatGPT API和微调功能。就像计算机的操作系统一样,Windows和iOS是目前两种主流的移动操作系统,而ChatGPT API和微调功能的开放,也为AI应用提供了技术底座。也就是说,产品开发者们可以在GPT的技术平台上构建符合自己要求的各种应用系统,使之成为更加称职的办公助手、智能客服、外语译员、家庭医生、文案写手、编程能手、职业顾问、置业顾问、私人律师、面试考官、旅游向导、创意作家、财经分析师等——这也为AGI的诞生以及由此对有关产业格局的重塑、新的服务模式和商业价值的创造,开拓了无限的想象空间。