购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

第三章

人机智能的产生过程

子云、相如,同工异曲。

——韩愈

毫无疑问,人脑拥有迄今为止我们所知的世界上最高的智能。同时,我们也认为某些机器是智能的,比如我们会说手机是“智能”的,会下棋的AlphaGo是“智能”的。人类的智能和利用人工智能实现的机器智能的产生的过程是否一样呢?

一、人脑智能的产生过程

你可以通过学习学会解x+1=10的方程,也可以记住早饭吃了什么,像学习、记忆之类都属于人脑智能的表现。简单一点的感知,比如听、看,也可以看作人脑的一种智能。人脑智能可以有效地感受到外部刺激,也可以对外部刺激做出适当的反馈。

我们以人脑的“看”——识别下图中的小孩为例来看看你的大脑是如何产生智能的。

人工智能技术生成的人像

光和声音一样也是一种波,根据《人脑之书》 中的描述,当光线照射到图中人物的脸部时会产生反射。被反射的光穿过眼角膜通过瞳孔进入你的眼睛,这束光经晶状体汇聚落在视网膜的感光细胞上。感光细胞受到光线刺激而被激活产生电信号,这些电信号会被送往大脑中的初级视觉皮层。

在一般情况下,初级视觉皮层接收到信号后,会分两条路把视觉信息发送出去做更高级处理。

其中一条叫作where通路。where通路是专门用来计算所识别事物的方位、运动等信息的,比如路上川流不息的车辆,舞蹈演员轻柔曼妙的舞姿等。where通路受损的人无法辨别与物体空间关系和物体运动相关的信息。他们能看到出现在面前的物体,但是动手去抓就会出现障碍——抓不住。他们看运动的东西会出现类似视频卡顿时的画面,所有的画面都是断断续续不连贯的,所以他们在倒水、过马路的时候会出现困难(开始看时水还没有满,然后就发现水莫名其妙地满了;开始看到路上没有车,等车撞上他们了,才发现车已经出现在面前)。

另外一条是what通路。what通路是用来处理识别所见事物的形状、颜色等信息的。比如上页图里小孩的面部轮廓会通过what通路送到面部识别区。面部识别区中的神经负责对不同的面部信息进行抽象识别,有的神经识别人物的眼睛,有的神经识别人物的肤色,有的负责识别眉毛等,不同的神经分工合作识别出人物整张脸的面部信息。

通常来说,从面部识别区域抽取的信息,会被进一步送往其他区域,比如与记忆相关的区域做进一步处理。因为人类对人脸的识别需要不同神经细胞之间的相互协作。当人脑中的面部识别区域异常时,病人会出现脸盲症。

此外,人脑的面部识别区能识别面部的主要特征,但是它对倒置的画面特征并不敏感,比如,你可能会认为上页图中右边的图是左边的图旋转180度之后的结果,现在,你可以把书旋转180度再试试。发现了吗?左边的人和右边的人是有差别的。

对于人类智能的产生过程,我们只知道是感官将外界的信息送入大脑,但是从接收信息到产生智能这个过程中的细节还有待科学探索。比如前面所说的人类“看”的过程,我们可能知道看到的人脸是怎么达到大脑中的视觉神经细胞的,也知道有哪些神经细胞参与了看的过程,但是现在还很难讲清楚人的意识是怎么产生的。比如上页图中的小孩,看到的时候你会迅速知道不认识这个小孩,但目前的科学水平还很难解释你是如何意识到不认识这个小孩的。

【延伸阅读】

不完美的眼睛

视觉的形成依赖于晶状体把光线汇聚到视网膜上,视网膜上的感光细胞接收到光线信号的刺激而兴奋,产生动作电位,再由专门负责传导这种兴奋的神经把信号传输至大脑的视觉中枢。为了简单起见,我们可以将传导信号的神经想象成导线的样子,下页上图是两种眼睛中视网膜的结构,你觉得人眼的结构是哪一种?

两种不同的眼睛构造

结构A与结构B最大的区别在于感光细胞是否覆盖在传导神经下面。结构A中光线先到达感光细胞再由传导通路传回视觉中枢。结构B中光线透过传导通路才能到达感光细胞,所以如果传导通路要绕到眼睛后面传递信息回大脑,只能穿过其后的感光细胞才行。

结构A比结构B更“完美”,但让人沮丧的是所有脊椎动物的眼睛都是属于图中B的结构。

视网膜细胞剖面图

人眼视网膜的细胞可以分为三层。前面两层(上图中的2、3)负责把视觉信号送到人脑的视觉中枢形成视觉,最后面的那层是感光细胞。视觉的形成需要光线的刺激,显然感光细胞(上图中的1)本来应该是在最前面接收光线,然后把信息传给2、3,再由2、3传回大脑的。但人眼视觉信号的形成和传送方式是光线先“穿过”2、3,再被1获取到,然后1把信息传送给细胞2、3,再由它们传送回大脑。人脑的视觉中枢相对于人眼的位置靠后,所以显然1比2、3离视觉中枢更近,而细胞2、3要连接人脑后面的视觉中枢,必须透过感光层的细胞(上图中1),不得不在感光细胞层“凿”个洞让信号能顺利通过。

这种结构造成人类眼睛的两种天然缺陷:生理盲点和视网膜脱落风险。比如你闭起左眼,用右眼看上页下图左边的文字,把书拿到一臂长的位置再慢慢靠近你的眼睛,在此期间右眼始终注视“人脑”并用余光看“AI”,在其中的某一个位置,你会发现“AI”消失不见了,这就是盲点。盲点对人类最大的困扰是触发交通事故,如果司机行车过程中因为盲点而无法及时看到行人和车辆,就有可能产生悲剧。

盲点的产生源于B结构中传导通路在视网膜的感光细胞上“凿”出的洞。在这个“洞”上,由于感光细胞的缺失,视网膜的那个点就无法捕获光线。当晶状体的光线落在盲点上时,人类无法感知。

另一方面,人眼不完美的构造也是造成视网膜脱落的原因。年龄增大、脑部损伤、高度近视等因素都可能增加视网膜脱落的风险。视网膜脱落会对视觉产生负面影响,严重的还可能造成失明。

和人类的眼睛不同的是章鱼的眼睛。章鱼的眼睛属于图中的结构A,它们的感光细胞在外层,负责将视觉信息传送回大脑的细胞在内侧,所以章鱼不存在盲点,视网膜脱落之类情况发生的概率也比人类要小很多。

二、机器智能的产生过程

和人类智能的产生过程非常相似,来自外部非刺激信息需要传输至机器最核心的信息处理部位进行处理。到目前为止,机器智能一定程度上是在模仿人类的智能,比如模仿人类听人讲话,模仿人类认出熟悉的人、熟悉的动物,模仿人类做出决策。由于机器和人类产生智能的核心部件的差异性,在人工智能驱动的智能机器中,大部分机器更倾向于将外界输入数字化,通过数字分析形成智能。我们再次以“看”为例来说明机器产生智能的过程。

如果要让机器像人一样“认出”一个人,必须将机器的“眼睛”捕获到的信息传输至机器的“脑”。具备照相功能的设备(如摄像头)是机器的“眼睛”。摄像头捕捉到的信息无论视频还是照片,最终都可以转化成数字图像。将数字图像传输至机器的“脑”进行数字分析,就可以实现机器的“看”。

数字图像的本质是像素点,不断地放大数字图像,你会发现图片是由很多个小方块构成的,如下页图(b),这些小方块就是像素点。每个特定的像素点都有一个颜色,比如下页图(b)方框中的颜色是棕色。每种颜色可以有三个与之对应的数值,这三个数值被记为RGB。下页图(c)圈出的像素点的RGB值是177、125和104。一张数字图像对于机器来说就是一堆数字。

机器中图像与数字的关系

思考与实践

1.3 平时见到的照片,有的是彩色的,有的是黑白的,那黑白照片又是怎么用数字表示的呢?

对比几张数字图像,你会发现不同图像的像素点组合是不一样的,因为图案不一样,颜色及其出现的位置自然会有差异。机器将采集到的人脸照片形成一堆描述数据存储在存储器中。当需要对数字图像进行识别时,图像数据会被载入运算器,再根据人工智能技术对应的指令进行操作计算,最后识别出结果。

和人类识别人脸的过程不同,人类对于现在帮助机器识别人脸的核心技术有着清晰的认识,毕竟人工智能这项技术诞生于人类的智慧中。那么为什么人工智能可以帮助机器实现智能呢?它有什么过人之处呢?本书将会在接下来的部分为你一一揭晓。 zpSfpNArXuWFxwhSd+RoVtA3r1vS7BZhTtyDEeh3+KdM1szEtdV1KQSdPBSqxP3i

点击中间区域
呼出菜单
上一章
目录
下一章
×