在20世纪七八十年代的“寒冬”里,仍有一些人执着于神经网络研究,科学界把他们视为狂热的疯子。比如,芬兰人戴沃·科霍宁(Teuvo Kohonen),他研究的是一个与神经网络比较接近的课题——联想记忆。再比如,还有一群日本人,与西方不同,日本的工程科学生态系统比较孤立,其中包括数学家甘利俊一(Shun-Ichi Amari)和一位名为福岛邦彦(Kunihiko Fukushima)的业内人士,后者发布了一个被他称为“认知机”(Congitron)的机器,这一命名来自术语“感知器”(preceptron)。福岛邦彦前后一共发布了这个机器的两个版本,分别是20世纪70年代的认知机和80年代的神经认知机(Neocognitron)。与同时代的弗兰克·罗森布拉特一样,福岛邦彦也受到了神经科学新发现的启发,特别是美国人大卫·休伯尔(David H. Hubel)和瑞典人托斯坦·威泽尔(Torsten N. Wiesel)的发现给予了他很多灵感。
休伯尔和威泽尔是两位神经生物学家,他们因在猫的视觉系统方面的研究成果获得了1981年的诺贝尔生理学或医学奖。他们发现视觉是视觉信号通过几层神经元传递后呈现的结果,包括从视网膜到初级视觉皮层,再到视觉皮层的其他区域,最后到颞下皮层。在这些层级中,神经元发挥着非常特殊的作用。在初级视觉皮层中,每个神经元仅连接到视野的一小部分区域,即接收区域。这些神经元被称为简单细胞。在下一层,即视觉皮层中,其他单元集成了上一层激活的信息,使得视觉对象即使在视野中稍微移动,视觉系统也能保持图像的呈现。这些单元被称为复杂细胞。
福岛邦彦便是受到这个研究成果的启发,延伸出了一个想法:先利用一层简单细胞检测各个小接收区域所接收的图像的简洁信息,再利用下一层复杂细胞处理收集到的信息。他研发的神经认知机共有5层:简单细胞、复杂细胞、简单细胞、复杂细胞,最后是类似感知器的分类层。福岛在前四层使用了某种“不受监督”的学习算法,也就是说,它们接受的是不考虑完成任务的、“盲目”的训练。仅有最后一层像感知器一样,接受了“受监督”的训练。但从总体来看,福岛邦彦缺乏一种可以调整所有层级参数的算法,所以他的网络只能识别诸如数字一类极其简单的事物。
在20世纪80年代初期,福岛邦彦并非独自一人在此领域进行探索,北美的一些团队也在进行着积极的探索,例如心理学家杰伊·麦克莱兰德(Jay McClelland)和戴夫·鲁梅尔哈特(David Rumelhart),还有生物物理学家约翰·霍普菲尔德(John Hopfield)和特伦斯·谢诺夫斯基(Terry Sejnowski),以及计算机科学家杰弗里·辛顿。辛顿与我共享了2018年度图灵奖。