现实世界是动态变化的,对其准确感知和理解是认识、适应和改造世界的前提。人类往往利用视觉、听觉、触觉、嗅觉等多种方式感知世界,并综合运用多种信息进行环境推理和决策。但是,在所有传感信息中,视觉是人类感知和认知世界的最重要手段,通过视觉获得的信息占全部感觉信息的70%以上。为了更精准和全面地感知世界,人类研发了各种视觉传感系统(如望远镜、显微镜等)对所关注的场景或对象进行多层次、多方面的观测,这些系统可产生大量的数据供人类分析和理解,由此引出了机器视觉(machine vision)。
机器视觉是人工智能的“眼睛”,是人类视觉能力的模拟、延伸和扩展,主要解决智能体看得见、看得准和看得懂等问题。从自动驾驶到智慧交通,从卫星遥感到智慧工业,从智能制造到智慧医疗,机器视觉是诸多领域实现突破性创新的关键核心技术,是目前人工智能研究最为活跃、应用最为广泛的领域之一。
近20年来,随着深度学习的发展,机器视觉在技术深度和应用广度方面均取得了长足进展。然而,相对于进化了数亿年的生物视觉系统,机器视觉技术的发展还不到百年,其智能化水平和适应能力还远不及人类视觉系统。因此,在介绍机器视觉基本原理和典型技术之前,有必要回顾人类视觉的基本机理和信息机制,以更好地理解现有机器视觉方法的本质,以及其对于人工智能的重要性。