生理学研究表明,人类视觉总是试图将图像解释为3D表面结构 [50,51,52,53,54,55] 。人类的3D感知能力是人类视觉的核心,在对世界的认知与识别中扮演着重要角色。但是,由于单幅图像3D 重构的固有歧义性,人们从不同视点观察得到的同一表面的估计结果也可能是不相同的。
计算机视觉的基础研究表明 [56] ,对于任意一个图像对,存在一个Lambertian表面,即在两种不同光照条件下产生两幅图像 [57] 。这意味着,不存在表面图像的任何一个非平凡函数,能在照度变化时保持完全不变。因此,单幅图像的3D重构问题是严重约束不足的,不可避免地存在歧义性,必须增加一些假设条件,如深度、明暗、纹理畸变等,这些性质在投影图像中留下了一些有用的暗示线索。基于单幅图像的3D重构方法正是充分利用了这些遗留痕迹。
歧义性大致可分为局部歧义性和全局歧义性两类。在局部区域,关于深度的暗示信息一般具有很大的歧义性,因此,若想从一个较小的图像窗口中恢复3D形状是不可能的。
图1.16所示即为局部歧义性,仅通过将图案上下倒置,即可产生不同的感知效果。
图1.16 局部歧义性示例
全局歧义性的情况一般存在于整体性重构方案中。图1.17所示的是in/out Necker倒置歧义性。
图1.17 全局歧义性示例——in/out Necker倒置歧义性
Necker 立方体由 Necker 等于 1832 年首次提出 [58] 。由于 Necker立方体具有很强的歧义性,常用于测试人类视觉系统的计算机模型,判断其能否达到和人类视觉系统感知一样的解释结果。如果立方体棱边以不相容方式交叉,则不可能构成几何物体,如图1.17(b)所示。人类通常不会看到立方体的一个不相容的结果。对于如图1.17(a)所示的Necker立方体,大多数人首先看到的是如图1.17(c)所示的面,这可能因为人们是从上面俯视物体,而且是从左到右扫描物体。如果换一种观察角度,会得到如图1.17(d)所示的另一种效果。
歧义性研究很重要,因为歧义性揭示了基于特定假设的自底向上重构方法的局限性,而不管所用的优化过程有多么成功。正是由于歧义性的广泛存在,使得人们对单图像3D重构的研究热情在很长一段时间内降到冰点,直到最近数年才又逐步得到重视。