人类视觉系统主要包括眼睛、视皮层等器官和组织结构,其在功能上负责视觉信息的获取和处理,以及视觉的产生。如图1-1所示,视觉信息的获取主要来自眼睛,它可以捕捉观察范围内的信息,例如颜色、几何信息、光照强度等,而对这些信息的加工处理则是在视网膜和视皮层等结构中进行的。接下来我们将分别介绍视觉器官的基本结构和视觉的产生过程。
图1-1 人类视觉系统
人眼是人体最复杂的感觉器官,如图1-2所示,从外形来看,眼睛是一个充满液体,直径2~3 cm的球体。为方便理解人眼的结构,我们将按照光线进入眼球的顺序对人眼结构进行介绍。
图1-2 眼球结构示意图
眼睛坚硬的最外层叫作巩膜,该结构用来维持眼睛的形状。巩膜前1/6的透明部分被称为角膜,如果角膜形状不规整导致不规则的折射,则会造成投射到视网膜上的图像失真 [1] 。
脉络膜是眼睛的第二层,其前部包含睫状体和虹膜。睫状体是连接在晶状体上的肌肉区域,它通过收缩和放松来控制对焦时晶状体的大小。
眼睛最里面的一层是视网膜,它包含负责在弱光下形成视觉的杆状细胞,和负责颜色视觉和细节的视锥细胞。视网膜的中心为中央凹区域,该区域只含有视锥细胞,负责看清楚细节。视网膜含有视紫红质,这是一种可将光转化为电脉冲的化学物质,可促进大脑产生视觉。视网膜神经纤维聚集在眼睛的后部,形成视神经,它将电脉冲传导到大脑。
视觉皮层是大脑的主要皮层区域,负责接收、整合和处理视网膜传递的视觉信息。视觉皮层位于初级大脑皮层的枕叶,在大脑最后方的区域。通常所说的视皮层主要包括初级视皮层(V1)和纹外皮层(V2、V3、V4、V5)。V1各区域的神经细胞功能各不相同,例如,某一神经细胞可能会对眼球接收到的水平方向的刺激做出反应,另一神经细胞可能主要对直立方向的刺激做出反应。这些神经细胞被分组成不同的模块,各个模块用于分析视野特定区域。
研究表明,V2神经元根据“交叉方向抑制”原则处理视觉信息。具体而言,V2首先将具有相似方向的刺激组合起来,使人眼对物体边界位置微小变化的感知具有稳健性 [2] 。其次,如果一个神经元被一个特定方向和位置的刺激激活,那么与之相差90°方向的刺激将受到抑制。这些交叉方向的刺激以各种方式组合起来,使我们能够感知到各种视觉形状。
携带着外部世界结构信息的光线经过眼球中一系列光线折射系统(如角膜和晶状体等),会投射在眼球底部的视网膜上。在接收到光线后,视网膜上的光感受器细胞将光信号转换为电信号,传递给视网膜的信息加工细胞,进行初步的信息整合加工。随后由视神经细胞将视觉信息通过神经元脉冲的模式传递入大脑,视觉信息通过大脑视皮层中不同层次组织的处理和整合,最终形成人的视觉。
在人眼中,晶状体与视网膜的距离保持不变。眼睛通过改变晶状体形状从而改变光的路线实现聚焦。其原理与凸透镜成像类似,如图1-3所示,在靠近或远离成像物体时,我们的眼睛通过压缩睫状体或加厚晶状体,确保物体发出的光线在视网膜上聚焦,从而实现不同距离目标物体清晰成像。
图1-3 视网膜成像“近大远小”示意图
人类视觉系统不会因为被观察物体的旋转、平移、缩放等变化而改变对物体的识别和理解,这是因为每当我们看到各种物体时,我们的大脑都会提取物体本身的特征。例如,我们从不同视角、不同亮光环境、不同的距离观察同一辆汽车的时候,汽车的颜色、大小、角度都会发生较大的变化,但是我们不会误以为是不同的汽车。视觉不变性确保人类稳定地识别和理解变化的物象,这正是人类视觉系统的智能性所在。
当你走在街上时,视觉机制中有两种系统在起作用:“定向注意力”系统和“发现注意力”系统。“定向注意力”系统可以防止人撞到东西,并协助人们行走,它可以让你理解周围环境并规划路径,防止摔倒或撞到路灯柱。在该机制下,大脑不需要对周围环境进行全面理解,因而反应迅速且节省能量。当你在商店橱窗里看到一些有趣的东西时,你会切换到发现系统来仔细观察它们,此系统叫作“发现注意力”系统,该系统协助大脑从我们的记忆中收集信息,以获得对场景的全面理解,这一过程相对缓慢。