人工智能的兴起,除了机器学习与深度学习带领风潮,计算机视觉也是众多工程师钻研的主题。多次与教育界的朋友聊天,一致感觉目前国内缺乏这方面的书籍,这也是笔者撰写本书的动力。
其实要对一幅图像做分析,让计算机认知图像本质,牵涉许多复杂的数学运算,所幸OpenCV已经将这些复杂的数学运算封装成一个个的函数,让整个学习变得简单许多。然而学习一个知识如果只是会调用函数,不了解函数内部数学原理,所设计的程序也只是空洞而没有灵魂的代码,为此笔者在撰写本书时除了采用当下热门的Python语言,还采用两步说明:
(1) 函数数学原理解说 。
(2)套用函数讲解 图像创意 与 计算机视觉 的实例。
在撰写本书时,笔者先从图像原理说起,逐一解说从图像到计算机视觉所需的完整知识。本书的主要内容如下:
完整解说操作OpenCV需要的Numpy知识;
图像 读取 、 显示 与 存储;
认识 BGR 、 RGB 、 HSV 色彩空间;
建立 静态 与 动态 图像,打破OpenCV限制建立 中文输出函数;
图像计算与图像的 位运算;
重复曝光 技术;
图像 加密 与 解密;
阈值 处理;
隐藏在图像中的情报;
数字水印;
图像几何变换: 翻转 、 仿射 、 透视 、 重映射;
图像滤波器;
认识 卷积;
认识与 删除图像噪声;
数学形态学: 腐蚀 、 膨胀 、 开运算 、 闭运算 、 礼帽运算 、 黑帽运算;
从 图像梯度 到内部图形的 边缘检测;
图像金字塔;
图像 轮廓特征 与 匹配;
轮廓的 拟合 、 凸包 与 几何测试;
霍夫变换与 直线检测;
无人驾驶车道检测技术;
直方图、增强图像对比度、修复 太亮 或 太黑 图像、 去雾 处理;
模板匹配 ;
傅里叶变换的方法与意义、 空间域 与 频率域 的切换;
分水岭算法执行 图像分割;
图像撷取;
图像修复: 抢救《蒙娜丽莎的微笑》;
识别手写数字;
OpenCV的摄像功能、活用 拍照 与 录像;
应用OpenCV内建的哈尔特征分类器;
检测 人脸 、 身体 、 眼睛 、 猫脸 、 车牌;
人脸识别 原理与应用;
建立哈尔特征分类器 执行车牌识别 。
笔者写过许多计算机图书,本书沿袭笔者著作的特色,程序实例丰富。相信读者只要遵循本书内容进行学习,必定可以快速精通OpenCV,设计计算机视觉的应用程序。本书虽力求完美,但谬误难免,尚祈读者不吝指正。
读者可扫描下方二维码,获取相应学习资源。
附录A
附录B
程序实例素材与代码
习题素材与解答
洪锦魁
2023.03