



迄今为止出现过三次AI浪潮。
第一次浪潮发生在我出生前的20世纪50年代,其开端是20世纪40年代问世的叫作“神经网络”的AI。
AI的种类繁多,神经网络是最古典的形式之一,它在计算机中连接了大量的人工神经元,建立起人工神经回路。简而言之,这个思路受大脑中实际存在的神经回路的启发。当时的研究证明,模仿大脑神经细胞的人工神经元使逻辑演算成为可能,马文·明斯基博士在这一发现的启示下,于1951年提出了神经网络的观点
。刚才介绍的感知机便是神经网络的典型代表。
大脑中的神经元依靠突触(神经元相互接触的部分)形成回路,同理,AI也拥有一个创造网络的系统。在明斯基博士学说的指引下,AI研究随后开启了轰轰烈烈的进程。
1956年达特茅斯会议召开后,AI研究迈出实质性步伐。此后,国际象棋程序以及早期的自然语言处理系统的研发不断推进,人们热切期待出现一个“像人类一样具有智慧的AI”。但是很遗憾,由于当时的计算机处理能力和存储空间的限制,大家的愿望落空了,AI的热度逐渐降低,第一次AI浪潮结束了。
随着计算机和数据管理技术的发展,第二次AI浪潮兴起于20世纪80年代。彼时,我还是一名中学生,擅长物理和数学,爱好编程并坚持自学。在此过程中,我意识到自己正处于第二次AI浪潮之中。
在第二次浪潮中崭露头角的是现在依然应用于生成式AI的深度学习技术,而在第二次浪潮的初始阶段问世的神经网络“新认知机”(neocognitron)对深度学习的构想起到了推动作用。
1979年,任职于NHK(日本广播协会)广播科学基础研究所(现在的NHK广播技术研究所)的福岛邦彦先生发明了新认知机
。这项技术的划时代意义在于,它是以人脑结构中的大脑皮层为基础设计而成的。大脑皮层包含6层结构,信息可以跨层传递,进而实现信息的抽象化,并加深对其的理解。
福岛先生是视觉神经回路网的研究者,他借助计算机向人们再现了眼睛获取的信息是如何经过大脑处理的。光在视网膜被转换为神经信号进入视神经,传递到大脑控制视觉的区域。新认知机模仿大脑皮层的6层结构,具备7层结构,能够处理与各层相对应的电信号。这种特殊的构造使新认知机擅长处理图像,引得一些专家疯狂追捧。
新认知机为深度学习打下了坚实的基础,不过此时它的拥趸还只是一部分人。原因之一是,当时的计算机性能较差,不具备现在的计算机那样强大的计算处理能力。按照如今的眼光,当时的计算处理简直仅有计算器的水平,完全不足以承担大规模深度学习的计算。
另一个原因是那个年代没有巨大的数据库,即大数据。计算机开展深度学习需要海量的信息,仅仅输入少量的数据无法让计算机充分发挥能力。现在,由于互联网的普及,我们可以构建大型数据库,相比之下,当时的数据远远不够。
在算力和数据不足等因素的影响下,新认知机偃旗息鼓了。