所以要讲清楚DeepSeek,还要从人工智能说起。
智能本身是难以定义的。我们称自己为智人(有智慧的人),是因为智能对我们来说尤其重要,但是千百年来没有人能给智能下一个令人信服的清晰的定义,以至于智能的近义词诸如智慧往往沦为大话和谎言的开场白。
早在艾伦·图灵开始研究人工智能时,他通过提出一个判断机器是否具有智能的标准,巧妙地避开了给“智能”下明确定义的难题。图灵提出,如果一台机器能够在与人类的对话中表现得足够自然,以至于人类无法区分它与真正的人类之间的区别,那么这台机器就可以被认为具有智能。
这就是1950年,图灵在其论文《计算机与智能》中提出的大名鼎鼎的图灵测试。时至今日,每隔一段时间就有研究团队试图通过图灵测试来验证他们人工智能系统的智能水平。但遗憾的是,至今没有一个系统能完全通过这个测试,即使是目前最先进的AI模型,也尚未实现图灵最初的愿景。
图灵的论文在学术界引起了广泛关注,吸引了越来越多的学者加入对机器智能的研究。其中,就包括达特茅斯学院年轻的数学助教约翰·麦卡锡,以及哈佛大学年轻的数学和神经学家马文·明斯基。
1956年,麦卡锡、明斯基等科学家在美国达特茅斯学院召开会议(见图2-1),首次提出“人工智能”(artificial intelligence, AI)的概念,标志着现代AI呱呱坠地。麦卡锡提出的“让机器像人一样思考、学习和自我改进”成为会议的宣言,也成为几代人奋斗的目标与动力。
图2-1 达特茅斯会议与会者
图片来源:Courtesy of the Minsky family。
这场为期两个月的研讨会更像是一场科学乌托邦:明斯基展示了早期的神经网络模拟器Snare;艾伦·纽厄尔和赫伯特·西蒙带来了“逻辑理论家”(Logic Theorist)程序,这是当时唯一可以工作的人工智能软件,成功证明了《数学原理》中的38条定理,其中两条定理的证明比罗素和怀特海的更简洁;克劳德·香农则把注意力放在“会下棋的机器”上。当与会者围坐在草坪上乐观地畅想“一个暑假造出能媲美人脑的机器”时,没有人会想到他们将开启的是一场长达69年的跋涉,并且至今也没有走到尽头的迹象。
人工智能的探索之旅之所以走得如此艰难,究其根源,在于人工智能在一开始就走上了看似平坦实则艰险无比的道路——符号主义。
符号主义,又称逻辑主义,是人工智能领域早期的一个重要流派。如果用一句话来描述符号主义的思想,那就是将现实世界抽象为可被机器识别和计算的符号,利用运算模仿人脑思考,通过逻辑推理来认知世界。简而言之,符号主义认为智能就是计算。由于逻辑和计算是人类典型的心智活动,因此符号主义也常常被称为心智派。
科研界早期对符号主义的热情拥抱与坚定信心,源于四大历史合力的交织作用——认知科学的范式契合、技术突破的示范效应、冷战背景下的战略驱动以及社会想象的集体建构,这种集体信念既折射出时代的认知局限,也反映了技术革命初期的典型特征。
符号主义将智能简化为符号操作,与笛卡儿“我思故我在”的理性主义哲学一脉相承。1956年达特茅斯会议明确指出:“学习或其他智能特征的每个方面,都应被精确描述,从而让机器模拟。”这种对人类理性的机械主义理解,契合了当时主流的认知科学范式。
维特根斯坦“语言的界限即世界的界限”的论断,在符号主义中演变为“符号的界限即智能的界限”。20世纪50年代的语言学家乔姆斯基提出的转换生成语法,为符号系统处理自然语言提供了理论依据,使人们相信语言理解可以通过语法规则来实现。
20世纪60年代兴起的认知心理学,将人类思维视为信息加工过程。这种类比使符号系统成为研究人类认知的理想工具,以至于1957年开发的通用问题求解器(general problem solver, GPS),直接模拟了人类解决问题的思维步骤。
20世纪50年代推出的IBM 7090计算机,其内存达32KB,运算速度为23万次/秒,这种技术进步让人们相信符号系统的计算瓶颈终将突破。1965年的DENDRAL系统,通过分析质谱数据自动推断有机分子结构,准确率达到化学家的水平。20世纪60年代诞生的摩尔定律提出,计算机算力每隔18~24个月就要翻一番。20世纪70年代推出的MYCIN医疗诊断系统,在血液感染诊断中表现优于初级医生。这些成功案例极大地鼓舞了研究者。
1957年苏联发射“斯普特尼克1号”卫星后,美国国防部高级研究计划局(DARPA)将AI列为战略重点。符号系统因其可解释性和逻辑可控性,被视为开发军事专家系统(如指挥决策辅助)的理想工具。
20世纪60年代,阿波罗计划需要复杂的任务规划系统。符号系统,如STRIPS(Stanford Research Institute Problem Solver)系统的分层规划为航天器路径规划提供了有效方法,反过来,这种实际应用也进一步巩固了符号系统的地位。
符号主义强调的理性设计与西方自由市场理念形成了隐喻对应关系,而苏联的控制论研究则侧重神经网络。这种技术路线的选择被赋予意识形态色彩,成为冷战时期竞争的一部分。
科幻作品,尤其是1942年阿西莫夫提出的“机器人三定律”和1968年上映的电影《2001太空漫游》,塑造了大众对智能机器的符号化想象。《2001太空漫游》中HAL 9000计算机的逻辑推理能力,成为符号主义的完美注脚。
20世纪60年代,IBM(国际商业机器公司)、DEC(美国数字设备公司)等将符号系统宣传为“第四次工业革命”的核心。1970年,《生活》杂志引用了明斯基的预言:“3~8年内,机器人将具有普通人的智能水平。”
20世纪60年代的计算机科学教育将符号逻辑作为核心课程。MIT(麻省理工学院)的Logo编程语言通过海龟绘图教学,强化了“符号操作即智能”的认知模式,培养了整整一代符号主义信徒。
如此形成的集体信心,本质上是特定历史条件下的认知泡沫。符号主义的局限性——常识推理缺失、组合爆炸、知识获取瓶颈——在当时被由技术进步带来的乐观情绪所掩盖。正如1961年明斯基在《迈向人工智能的步骤》中所宣称的:“在一代人的时间内,创造人类水平的智能将成为现实。”这种乐观主义持续到1973年《莱特希尔报告》的发布,才被残酷的现实打破。
符号主义的兴衰揭示了技术发展的普遍规律:初期的范式革命往往伴随过度的社会期待,而真正的突破往往发生在主流范式的边缘。DeepSeek的R1模型正是这种规律的当代体现——当硅谷醉心于“更大更强”的符号主义式扩张时,杭州团队通过统计学习的创新路径,在AI领域创造了新的可能性。
这段历史或许正如理查德·萨顿于2019年发表的《苦涩的教训》(The Bitter Lesson)中所揭示的技术发展的冷酷逻辑所概括的那样:“人类引以为傲的智慧与经验,在算力与数据的洪流中可能沦为次要因素。”这段历史不仅关乎技术演进,更映射出人类对智能本质认知的嬗变——从“机械复制思维”到“涌现创造智能”,我们终于学会敬畏复杂性,承认有些奇迹只能诞生于规模与混沌之中。