计算机视觉是利用计算机模拟人类视觉,利用镜头和计算机代替人眼,使计算机拥有人类视觉的能力,对图像和视频中的目标进行分割、分类、识别、跟踪、判别、决策等。计算机视觉是一门交叉学科,涉及的领域包括计算机科学(图形、算法、理论、系统、体系结构)、数学(机器学习、信息检索)、工程学(机器人、语音、自然语言处理、图像处理)、物理学(光学)、生物学(神经科学)和心理学(认知科学)等。计算机视觉的目标是对环境的表达和理解,核心问题是研究如何对输入的图像信息进行组织以及如何对物体和场景进行识别,进而对图像内容进行解释。常见的应用领域包括图像检索和分类、人脸检测和识别、物体跟踪、视频监控、生物识别技术、游戏和控制等。人工神经网络和深度学习的最新研究进展极大地推动了计算机视觉技术的发展。
本书通过大量编程实践案例,全面系统地介绍了计算机视觉及其相关领域的核心内容。全书共10章,包括基于Python 3在各种平台上安装OpenCV 4、文件、OpenCV的I/O功能、摄像头及图形用户界面处理、基于OpenCV的图像处理、深度估计与分割、人脸检测和识别、利用图像描述符进行图像检索和搜索、构建自定义物体检测器、物体跟踪、摄像头模型和增强现实,以及基于OpenCV的神经网络导论等内容。
为了便于读者学习,作者在GitHub上提供了相关案例的完整源代码,供读者下载使用。通过书中提供的案例代码,读者可以快速熟悉和掌握计算机视觉领域的相关知识。本书既适合那些想要从事计算机视觉及其相关领域研发的初学者阅读,也适合那些致力于计算机视觉研究、希望扩展和更新技能的高阶读者阅读。但是对于初次接触计算机视觉及其相关领域的人员来说,在阅读本书前,建议先阅读一下OpenCV 4和Python 3等编程书籍,或者事先学习一下有关OpenCV 4和Python 3编程的在线教程。
本书由重庆邮电大学教师刘冰博士和高级工程师高博历时四个多月的时间翻译完成,同时本书获得了重庆邮电大学博士启动基金(E012A2020215)的支持。为了能够准确地翻译本书,译者查阅了大量有关OpenCV 4、Python 3以及计算机视觉等方面的中外文资料。但因水平有限,译文中难免存在不当之处,恳请读者批评指正。
感谢机械工业出版社华章公司的编辑们,是他们的严格要求,才使本书得以高质量出版。
刘冰
liubing@cqupt.edu.cn
2021年3月