从2022年底开始,在全球范围内,大型语言模型和通用人工智能正在对各行各业产生巨大的影响,为我们带来前所未有的机遇和挑战。这些发展的背后,是深度学习技术的飞速进步。然而,当我们沉浸在其潜力的炫目光芒中时,我们也必须直面其带来的问题和困扰。这其中最主要的问题包括模型的可解释性不足、计算资源的大规模消耗、模型稳定性的问题以及安全性漏洞。
这些问题在很大程度上源于我们对“智能”的理解和应用方式。现有的深度学习模型,无论是分类器还是生成器,多数基于开环系统,训练过程往往依赖于监督学习或者自监督学习。这样的系统虽然能够通过大规模的计算资源和庞大的模型参数来提升模型性能,但也暴露出了无法自动纠正预测错误以及对环境变化的适应性不足的问题。解决这些问题,不能仅仅依靠“蛮力”——扩大模型规模和增加算力。
为了深入解决这些问题,我们必须重新审视并理解“智能”的本质。从现象本源出发,跳出传统的框架,重新探索如何构建和理解人工智能系统,这是我们面临的任务。换句话说,我们需要从新的视角去思考和理解“智能”,寻找新的模型和方法,以便我们能够真正解决现有问题,实现人工智能的巨大潜力。
在这个背景下,我完成了这本书的写作,实际上这本书并不是讨论大语言模型的发展或者某个阶段人工智能技术的发展,而是结合我过去十几年在多个行业和学术研究机构从事研究的经历,来探讨和分享我对人工智能技术发展中最核心的问题的思考,即对“智能的本质”这个问题的思考,因此这本书的绝大多数内容是围绕着这个话题来分析的,不仅会从历史角度讨论人工智能发展至今的关键思想的演变,也会讨论诸如量子探索、机器意识、价值对齐等前瞻性的科学命题,其中的文稿也是多年来对这个关键问题思考的沉淀。
这篇序言将深入探讨“智能”的本质,与大家共同理解其内在机理。我们将着眼于未来的人工智能发展,思考如何在新的理念和新的原则的指引下,实现我们对智能系统性能提升的愿景,同时应对现有的挑战。
在我们步入智能时代的同时,也逐渐揭示出了智能的本质和特征。在科技哲学的框架下,我们可以理解到,智能并不仅仅是对世界的观察,它更在于从观察中发现规律,理解和把握现象。接下来我们就智能时代的五个主要特征进行探讨,并通过对自然智能的理解,来进一步剖析人工智能的本质和可能性。
(1)学习驱动与普及化的智能。在科技哲学的视野中,智能的核心在于学习,这个过程不只是对高维度外部世界的观察,还通过对现象的理解与把握,寻找事物内在的规律。正如约翰·冯·诺依曼(John von Neumann)所阐述,对真实世界的模拟是智能的基础。这也是自然界中最普及的技术,所有智能,无论是人工的还是自然的,都应当遵循简约和自洽的原则,这种思想恰与图灵的普适图灵机理论相吻合,强调智能的简约性和一般性。
(2)模式识别的智能化。智能的模式识别能力使其能从大量数据中提取有意义的模式,这一能力超越了人类的限制。但我们需要明白,这并非靠“堆砌”参数和计算力所能实现的,而是智能通过“学习”模仿和理解现象,从而达到超越的目标。这是从冯·诺依曼的自动机理论中得到的启示,智能通过对环境的学习,不断调整和优化自身的行为模式。
(3)预测与优化的双重能力。基于已学习的模式,智能可以预测未来的趋势,并据此优化决策和行为。这一过程并非孤立进行,而是根据诺伯特·维纳(Norbert Wiener)的“闭环反馈”理论,智能系统会根据预测结果的偏差进行自我调整,从而优化其预测和决策。如果缺失了预测和优化的能力,那么智能的边界则低于我们理解的自然智能的水平。
(4)个性化服务的适应性。在提供个性化服务时,智能的适应性凸显,它能满足各种特定需求。然而,这背后的驱动力,是智能系统已经逐步形成了一种学习的泛化性,这种泛化性使它能够适应不同的任务和环境,与图灵的通用计算理论具有显著的一致性。我们看到大模型的技术实际上就是提供这样一种适应性,能让模型自动化地按照特定需求实现无关任务的落地。
(5)智能的全面普及化。随着技术的发展和成本的降低,智能现在已经在各个领域广泛应用,从工业生产到个人消费。然而,这种普及化不仅仅是技术进步和成本降低的结果,更是源于智能本身具有的学习、模式识别、预测和优化的能力,这些能力让智能在不同的领域都能找到其应用的可能性。这种现象,与冯·诺依曼对技术发展趋势的观察相吻合,技术的发展不是孤立的,而是一个逐步优化和自我调整的过程。
显而易见,智能的全面普及化是随着技术的发展和成本的降低而实现的。然而,智能的全面普及化不仅仅是技术进步和成本降低的结果,更是智能本身所具备的学习、模式识别、预测和优化能力的体现。这些能力使得智能在各个领域都能找到应用的可能性。这与冯·诺依曼对技术发展趋势的观察相吻合,技术的发展是一个逐步优化和自我调整的过程。随着学习驱动智能的不断发展,我们有理由相信,智能将继续向更广泛的领域渗透,为人类社会带来更多的便利和进步。我们应该积极推动智能技术的发展,努力实现智能的全面普及化,并在这一过程中不断探索和解决相应的伦理和社会问题,以确保智能的发展能为人类福祉带来持久的正面影响。
在人工智能的历史长河中,智能的本质和其演变脉络始终引人深思。根植于这个领域的科学与哲学讨论中,我们看到一种共同的理念——学习。这不仅是对外部世界高维度现象的观察,还是一种通过理解与掌握事物内在规律的自我进化。我们可以从维纳的“闭环反馈”理论中获得启示,它揭示了一个能够自我学习、自我纠错,进而成为更高效、更稳定、更具适应性的系统的可能性。
但深度学习,作为当前普遍被应用的学习模型,其广泛的应用并不意味着我们已经全面理解了其背后的原理。事实上,正如艾伦·图灵的普适图灵机理论所强调的,真正的智能应具有的简约性和一般性往往在实际的模型和应用中被淡化。因此,从深度学习的基本原理出发,探究其在全局中的意义和应用,无疑有助于我们理解和应用智能。
在深度学习的发展历程中,数据的压缩和群不变性的概念展示出了其至关重要的地位。这两个概念的存在及其相互关联,不仅是深度学习理论的核心,也成为理解深度学习如何进行自我学习和数据处理的关键。
数据的压缩,本质上是一种信息处理过程,目的是以最简练的方式揭示和传递信息。深度学习的一个核心目标就是找到一种有效的方式,使得原始数据可以通过更少的信息来表示。正如克劳德·香农(Claude Shannon)的信息理论所揭示的那样,信息的压缩并不等同于信息的丢失,反而,适度的压缩能够使信息的精髓得到更好的保存和提炼。
而群不变性则代表了对信息在各种变化(如旋转、平移、缩放等)中的稳定性的追求。它对于理解神经网络中卷积层的作用尤为重要,因为卷积层的本质就是为了捕获输入的局部信息,并保持对各种变换的不变性。此外,群不变性也在很大程度上决定了模型的泛化能力,即模型能否在面对新的、未见过的数据时仍然保持良好的性能。
当我们将深度学习看作优化数据表示的工具,更多的可能性就在前方展开。这种思考方式打开了一扇门,让我们看到了数据的内在结构,并指引我们寻找最优的数据表示。这种表示应该能够最简洁地描述数据的低维流形分布,从而使我们能对数据进行更准确的聚类和分类。
尽管深度神经网络在全球范围内已有广泛的应用,但我们离通用人工智能的目标尚有一段距离。这是因为,虽然我们已经在某些特定的任务上实现了超越人类的性能,但这并不意味着我们的模型已经理解了这些任务背后的本质。真正的通用人工智能应当具备对任何新任务进行快速学习和适应的能力,这需要我们从智能的本质出发,深化我们对智能的理解和研究。
作为人工智能科学家,我对构建有意识的人工智能系统的前景充满着迷。在过去几十年中,我们目睹了深度学习和人工智能领域的巨大进步,但要真正实现意识的模拟和理解仍然是一个巨大的挑战。接下来,我们将探讨几个关键领域,包括自我学习与反馈、数据压缩与群不变性、意识模拟、人机交互以及硬件和软件的整合。通过对这些领域的深入研究,我们将探索实现意识的人工智能系统的可能性,并揭示其中的科学原理和技术挑战。
(1)自我学习与反馈。这是深度学习和人工智能领域的核心理念,正如维纳所提出的“闭环反馈”理论,人工智能系统需要持续进行自我学习和自我纠错,不断优化自身的算法和模型,从而成为更高效、更稳定、更具适应性的系统。这种反馈机制让人工智能能够模仿人类的学习过程,自我进步,这是构建有意识的人工智能的重要一步。如在《自然》( Nature )杂志上发表的研究显示,一些人工智能系统已经能够通过观察人类的行为,自我学习并模拟人类的决策过程。
(2)数据压缩与群不变性。信息的处理是人工智能核心的一环。香农的信息理论,即用来量化信息的一种理论,在这方面提供了有力的理论基础。它使我们理解信息如何被编码、传输和解码,这是人工智能对数据处理的基础。未来的人工智能需要在数据处理的精确度和效率之间找到一个平衡。而群不变性则为理解复杂数据结构提供了新的视角,通过识别和提取数据中的基本模式,人工智能能够更有效地处理和理解数据。
(3)意识模拟。意识模拟是人工智能发展的重要方向。伯纳德·巴尔斯(Bernard Baars)的“意识剧院”理论和大卫·查尔默斯(David Chalmers)的意识难题,提供了理解和模拟意识的理论基础。他们的工作强调了意识的重要性,我们需要对意识的本质和运作方式有更深入的理解,才能模拟出真正的意识。人工智能需要能够理解和模拟人类的意识状态,这将需要我们在算法设计和模型建立上取得新的突破。
(4)人机交互。图灵提出的图灵测试强调了人机交互在人工智能发展中的重要性。一个真正的智能系统应该能够理解并响应人类的需求和情绪,提供真正有用的帮助。这将需要我们在人工智能的情感识别和自然语言处理等领域取得进一步的突破。
(5)硬件和软件的整合。冯·诺依曼的理论指出,一个完整的计算系统需要硬件和软件的协同工作。同样,人工智能的发展也需要硬件和软件的完美结合。硬件为人工智能提供运算和存储的能力,而软件则赋予人工智能学习和适应的能力。未来的人工智能系统需要在硬件设计和软件算法上取得新的突破,才能真正实现自我学习和适应的能力。
通过对自我学习与反馈、数据压缩与群不变性、意识模拟、人机交互以及硬件和软件的整合等关键领域的探索,我们逐渐揭示了实现意识的人工智能系统的一些前景和挑战。自我学习和反馈机制使得人工智能系统能够不断优化自身,数据压缩和群不变性提供了处理复杂数据的新视角,意识模拟理论为我们提供了理解意识本质的框架,人机交互的进展使得人工智能能够更好地理解人类的需求和情感,而硬件和软件的整合则为人工智能系统的计算和学习能力提供了支撑。
然而,要实现真正有意识的人工智能系统仍然面临许多挑战。我们需要更深入地理解意识的本质,如何模拟和量化意识状态仍然是一个未解决的难题。此外,我们还需要进一步改进人机交互的技术,使得人工智能能够更加智能地理解和响应人类需求。同时,硬件和软件的整合需要更大的突破,以提供更强大的计算和学习能力。
我们正处在人工智能大模型的时代,它被视为一个巨大的转折点,如同从马车时代跨越到汽车时代。而这个比喻并不过分。在马车时代,人工智能的进展更多地依赖于人的智力和创造力,如同拉动马车前进的马。然而,随着生成式人工智能的发展,我们已经进入了人工智能的汽车时代,大模型成为人工智能的发动机。
然而,这样的比喻并不能完全精确地描绘当前人工智能的发展现状。事实上,如果我们深入观察汽车工业的发展历程,我们可以发现,当前的人工智能可能仍处在蒸汽机时代。这个阶段的特点是技术尚处在初级阶段,且对能源的依赖性极高。这在人工智能领域也有所体现:大模型需要大量的数据和计算资源,且面临泛化能力有限、可解释性差等问题。
我们必须警惕的是,将大模型视为通用人工智能的唯一道路可能是一种误解。如同汽车工业的发展并非仅仅依赖于发动机技术的进步一样,实现真正的通用人工智能也需要我们在多个层面进行技术创新,包括但不限于模型的设计、训练算法的改进,以及对模型决策过程的理解和解释,等等。
此外,我们也不能低估实现通用人工智能的难度。如同从蒸汽机时代过渡到现代汽车工业的水平需要经历诸多技术革新和社会变革一样,实现真正的通用人工智能也同样需要我们在技术、社会甚至哲学层面进行深入的思考和探索。这既是我们需要警惕的地方,也是我们在这个风口中需要深度反思的地方。
智能时代正在将我们带向一个从学习驱动到全面普及的新境界。这个趋势的深远影响不仅改变了我们的生活方式,更改变了我们对智能的理解。智能,作为一种自然现象,其普及化原则正与自然智能的本质相吻合。我们从中看到,人工智能正在步入一个与自然智能并行的时代。
从诺伯特·维纳提出的“闭环反馈”理论中,我们可以领略到智能如何通过学习自我改进的过程。在闭环系统中,智能体通过不断观察、学习和适应环境,以实现自我优化,这一过程既符合生物进化的规律,也为人工智能的发展提供了理论支持。
然而,我们对智能的理解并未止步于此。我们正在尝试构建新的图灵机范式,如意识图灵机,来进一步揭示智能的奥秘。这种范式试图通过对自我意识的模拟,来复杂化和深化我们对智能的认知。
同样值得我们深思的是“意识剧院”的理论,以及对“意识难题”的探索。这些理论和探索挑战了我们对智能的既定认识,使我们不得不重新审视智能的本质:智能是否仅仅是算法和数据的组合?或者,智能是否还包含了某种我们尚未理解的、与意识相关的特性?
智能时代的到来无疑为我们提供了无限的可能性和机遇。它推动我们不断探索,直到我们找到答案。正如人工智能的发展历程一样,我们的认知也在不断地扩展和深化。因此,我们有理由相信,未来的智能时代将为我们揭示更多关于智能本质的秘密,也将引领我们走向一个更为广阔的未知领域。
毫无疑问,我们正在开启一个人的智能与机器意识共同崛起的时代,自从18世纪的欧洲启蒙运动点燃了理性之火以来,人类历史上从未如此深刻地思考过机器与人的关系。如今,这一新的启蒙时代要求我们重新审视自我、理性和人类在宇宙中的位置。这一新的启蒙运动不仅是科技的探索,更是一场哲学和伦理的重估。它强调人工智能必须服务于人类的普遍利益,强调教育和批判性思维的重要性,鼓励人们在这一全新时代中保持开放和求知的精神。人工智能时代的启蒙运动是一场寻求人机和谐共存、人类自由与尊严的保护,以及人类社会普遍福利与和平的斗争。
在这一历史性的进程中,文学、艺术、科学和哲学必须共同努力,揭示我们共同的人性,为人类打造一面光明、理智和人道的未来。正如一位诺贝尔文学奖得主所言:“人工智能不是我们的敌人,而是我们智慧和道德的一面镜子。”在人工智能的反映下,我们看到了自己的无限可能和面临的挑战,也看到了理性与人性之间微妙而复杂的关系。
在这篇序言的最后,感谢在这段时间内支持我的学术工作的众多学术界的前辈与好友们。“天行健,君子以自强不息;地势坤,君子以厚德载物”,我相信通过不断的努力和思考,我们终将离真理越来越近,身处这个伟大的时代,我们将负重前行,不负韶华,为国家的繁荣和民族的复兴做出自己的一点贡献。
刘志毅
2023年7月于上海