购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

1.5 计算机视觉概述

1.5.1 基本概念

计算机视觉是一门研究如何使机器“看”的科学,更进一步说就是指用摄影机和计算机代替人眼对目标进行识别、跟踪和测量等机器视觉,并进一步做图形处理,使用计算机处理成为更适合人眼观察或传送给仪器检测的图像。作为一个科学学科,计算机视觉研究相关的理论和技术,试图建立能够从图像或者多维数据中获取“信息”的人工智能系统。这里所指的信息指Shannon定义的,可以用来帮助做一个“决定”的信息。因为感知可以看作是从感官信号中提取信息,所以计算机视觉也可以看作是研究如何使人工系统从图像或多维数据中“感知”的科学。

计算机视觉是使用计算机及相关设备对生物视觉的一种模拟。它的主要任务就是通过对采集的图片或视频进行处理,以获得相应场景的三维信息,就像人类和许多其他生物每天所做的那样。

计算机视觉是一门关于如何运用照相机和计算机来获取我们所需的、被拍摄对象的数据与信息的学问。形象地说,就是给计算机安装上眼睛(照相机)和大脑(算法),让计算机能够感知环境。我们中国人的成语“眼见为实”和西方人常说的“One picture is worth ten thousand words”表达了视觉对人类的重要性。不难想象,具有视觉的机器的应用前景能有多么宽广。

计算机视觉就是用各种成像系统代替视觉器官作为输入敏感手段,由计算机来代替大脑完成处理和解释。计算机视觉的最终研究目标,就是使计算机能像人那样通过视觉观察和理解世界,具有自主适应环境的能力。这要经过长期的努力才能达到目标,因此,在实现最终目标以前,人们努力的中期目标是建立一种视觉系统,这个系统能依据视觉敏感和反馈的某种程度的智能来完成一定的任务。例如,计算机视觉的一个重要应用领域就是自主车辆的视觉导航,还没有条件实现像人那样能识别和理解任何环境、完成自主导航的系统。因此,人们努力的研究目标是实现在高速公路上具有道路跟踪能力,可避免与前方车辆碰撞的视觉辅助驾驶系统。这里要指出的一点是,在计算机视觉系统中计算机起代替人脑的作用,但这并不意味着计算机必须按人类视觉的方法完成视觉信息的处理。计算机视觉可以根据计算机系统的特点来进行视觉信息的处理。但是,人类视觉系统是迄今为止人们所知道的功能最强大和完善的视觉系统。

计算机视觉既是工程领域,也是科学领域中一个富有挑战性的重要研究领域。计算机视觉是一门综合性的学科,吸引了来自各个学科的研究者参与到对它的研究之中,其中包括计算机科学和工程、信号处理、物理学、应用数学和统计学、神经生理学和认知科学等。

计算机视觉包括图像处理和模式识别,除此之外,还包括空间形状的描述、几何建模以及认识过程(认知科学与神经科学)。实现图像理解是计算机视觉的终极目标。

· 图像处理:图像处理技术把输入图像转换成具有所希望特性的另一幅图像。例如,可通过处理使输出图像具有较高的信噪比,或通过增强处理突出图像的细节,以便于操作员的检验。在计算机视觉研究中经常利用图像处理技术进行预处理和特征抽取。

· 模式识别:模式识别技术根据从图像抽取的统计特性或结构信息把图像进行分类,例如文字识别或指纹识别。在计算机视觉中,模式识别技术经常用于对图像中的某些部分,例如分割区域的识别和分类。

· 图像理解:对于给定的一幅图像,图像理解程序不仅要描述图像本身,还要描述和解释图像所代表的景物,以便对图像代表的内容做出决定。在人工智能视觉研究的初期,经常使用景物分析这个术语,以强调二维图像与三维景物之间的区别。图像理解除了需要复杂的图像处理以外,还需要具有关于景物成像的物理规律的知识以及与景物内容有关的知识。

认知科学与神经科学(Cognitive science and Neuroscience)将人类视觉作为主要的研究对象。计算机视觉中已有的许多方法与人类视觉极为相似。许多计算机视觉研究者对研究人类视觉计算模型比研究计算机视觉系统更感兴趣,希望计算机视觉更加自然化、更加接近生物视觉。

在建立计算机视觉系统时,需要用到上述学科中的有关技术,但是计算机视觉研究的内容要比这些学科更为广泛。计算机视觉的研究与人类视觉的研究密切相关。为实现建立与人的视觉系统相类似的通用计算机视觉系统的目标,需要建立人类视觉的计算机理论。

1.5.2 计算机视觉的应用

人类正在进入信息时代,计算机将越来越广泛地进入几乎所有领域。一方面是更多未经计算机专业训练的人也需要应用计算机,另一方面是计算机的功能越来越强,使用方法越来越复杂。这就使人在进行交谈和通信时的灵活性与在使用计算机时所要求的严格和死板之间产生了尖锐的矛盾。人可以通过视觉和听觉、语言与外界交换信息,并且可用不同的方式表示相同的含义,而计算机却要求严格按照各种程序语言来编写程序,只有这样计算机才能运行。为使更多的人能使用复杂的计算机,必须改变过去那种让人来适应计算机、死记硬背计算机使用规则的情况;而是反过来让计算机来适应人的习惯和要求,以人所习惯的方式与人进行信息交换,也就是让计算机具有视觉、听觉和说话等能力。这时计算机必须具有逻辑推理和决策的能力。具有上述能力的计算机就是智能计算机。

智能计算机不但使计算机更便于为人们所使用,同时如果用这样的计算机来控制各种自动化装置特别是智能机器人,就可以使这些自动化系统和智能机器人具有适应环境和自主做出决策的能力。这就可以在各种场合取代人的繁重工作,或代替人到各种危险和恶劣环境中完成任务。

计算机视觉和机器视觉领域有显著的重叠。计算机视觉涉及被用于许多领域自动化图像分析的核心技术。机器视觉是人工智能的一个分支。简单来说,机器视觉就是用机器代替人眼来做测量和判断。在许多计算机视觉应用中,计算机被预编程,以解决特定的任务。计算机视觉应用的实例包括:

(1)控制过程,比如一个工业机器人。

(2)导航,比如通过自主汽车或移动机器人。

(3)检测的事件,比如对视频监控和人数统计。

(4)组织信息,比如对于图像和图像序列的索引数据库。

(5)造型对象或环境,比如医学图像分析系统或地形模型。

(6)相互作用,比如输入到一个装置时用于计算机与人的交互。

(7)自动检测,比如在制造业的应用程序。

其中,最突出的应用领域是医疗计算机视觉和医学图像处理。这个领域的特征信息从图像数据中提取用于患者医疗诊断的目的。通常,图像数据是在形式显微镜图像、X射线图像、血管造影图像、超声图像和断层图像的信息。比如,可以从这样的图像数据中提取肿瘤、动脉粥样硬化或其他恶性变化。它也可以是器官的尺寸、血流量等。这种应用领域还支持提供新的信息、医学研究的测量。计算机视觉在医疗领域的应用还包括增强超声图像或X射线图像,以降低噪声对图像的影响。

计算机视觉第二个应用领域是工业,这个领域中提取的信息用于制造过程。比如用于质量控制,自动检测最终产品的缺陷。军事应用是计算机视觉应用的最大领域之一,最明显的例子是探测敌方士兵、车辆和导弹制导。更先进的系统为导弹制导发送导弹的区域,而不是一个特定的目标,并且当导弹到达基于本地获取的图像数据的区域的目标做出选择。现代军事概念,如“战场感知”,意味着各种传感器,包括图像传感器,提供了丰富的有关作战的场景,可用于支持战略决策的信息。在这种情况下,数据的自动处理用于减少复杂性和融合来自多个传感器的信息,以提高可靠性。

一个较新的应用领域是无人驾驶汽车和无人机。无人驾驶汽车或无人机通常使用计算机视觉进行导航,即知道自己在哪里,要去哪里,并能检测障碍物。

1.5.3 与相关学科的区别

计算机视觉、图像处理与图像分析、机器视觉是彼此紧密关联的学科,基础理论大致相同。然而各研究机构、学术期刊、会议及公司往往会把自己归为其中某一个领域,于是各种各样的用来区分这些学科的特征便被提了出来。下面给出其中的一种区分方法。

计算机视觉的研究对象主要是映射到单幅或多幅图像上的三维场景,例如三维场景的重建。计算机视觉的研究很大程度上针对图像的内容。

图像处理与图像分析的研究对象主要是二维图像,可以实现图像的转化,尤其是针对像素级的操作,例如提高图像对比度、边缘提取、去噪声和几何变换(如图像旋转)。这一特征表明:无论是图像处理还是图像分析,研究内容都和图像的具体内容无关。

机器视觉主要是指工业领域的视觉研究,例如自主机器人的视觉,用于检测和测量的视觉。

模式识别使用各种方法从信号中提取信息,主要运用统计学的理论。此领域的一个主要方向便是从图像数据中提取信息。 m4f33ja7Q7D2m2wxNUlW6k3F8QdF5nrgxKqi5iZjKlxBjaUJs9+g5AyskMQdIp6E

点击中间区域
呼出菜单
上一章
目录
下一章
×