推理能力仅是人类智力的一个小分支,我们还擅长使用类比的方式进行思考,或以直觉作为行动参考,逐步积累经验,认知世界。感知、直觉、经验等都是后天习得的能力,或者说是后天训练出来的能力。
因此,如果我们想制造出一种接近人类智能的机器,首先要做的就是赋予它学习能力。人脑是由860亿个相互连接的神经元编织的网络组成的,其中约160亿个神经元活跃在大脑皮层中。每个神经元与平均约2000个其他神经元通过一种被称为突触的结构连接。神经元通过创建突触、删除突触或修改其有效性而进行学习。因此,目前最流行的机器学习方法便是建立人工神经网络,并通过修改它们之间的连接达到学习的目的。
我们可以列出一些基础原则。
机器学习的第一阶段可以被叫作学习或者训练,在此阶段,机器“学习”如何完成一项任务。第二阶段是实施阶段,此时机器不再学习。
为了训练机器识别一张图片中的物体有汽车还是飞机,我们首先需要提供数千张汽车或者飞机的图像,让机器学习。每次当机器捕获图片时,其由人工神经元相互连接组成的内部神经网——本质是由计算机计算的数学函数——便会处理该图片并输出相应答案。如果答案正确,那么我们什么也不需要做,直接转到下一张图片即可;如果答案不正确,那么我们可以调整机器内部的相关参数,即调整神经元之间的连接强度,使其输出的答案向正确答案靠近。从长远的角度来看,经过不断调整的机器最终可以识别任何物体,不论该物体是否曾经出现在它见过的图像上。我们将这种能力称为推广能力。
虽然机器识别图像的过程与人脑的工作原理相似,但机器与人脑之间依旧存在不可忽视的差距。我们来看一组对比数据:人类的大脑有86×10 9 个神经元,通过约1.5×10 14 个突触相互连接,每个突触每秒可执行上百次“计算”。一次突触计算相当于计算机进行上百次的数字运算(如乘法、加法等)。也就是说,一个正常运作的大脑每秒可进行1.5×10 18 次运算。当然,在现实中,大脑的神经元只有一部分一直处于被激活状态。相比之下,每个GPU每秒可执行10 13 次运算,因此,需要10万个GPU才能接近大脑的运算能力。还有一个关键点,即人类大脑消耗的功率大约为25瓦,而一个GPU的消耗是人脑的10倍,即250瓦。电子的效率是生物的一百万分之一。