购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

1.2 数字图像处理与深度学习技术简介

1.图像处理技术基础

数字图像处理是指通过计算机软件或编程对数字图像进行处理分析,并将结果进行数字化的表达。目前,数字图像处理技术已经在国民经济的许多领域得到了推广,如农业生产、工业制造、道路交通、民生医疗等现代生活各个领域都有数字图像处理的应用,是科技走进生活的切实体现。常用的图像处理方法有图像滤波、图像分割、图像变换等。其中,图像滤波是指对图像进行平滑或锐化处理,目的是去除噪声或增强图像局部细节;常用的滤波算法包括中值滤波、均值滤波和高斯滤波等。图像分割是将图像分为若干个区域,目的是在不同的区域上进行不同的处理;常用的分割算法包括阈值法、界限检测法、匹配法、跟踪法等。图像变换是将图像在空间域或频率域上进行变换,目的是使得图像在某些方面的表达更便于处理;常用的变换算法包括傅里叶变换、离散余弦变换和小波变换等。

为了验证各个算法的运行效果,著者将多种算法集成起来,形成一个图像处理仿真系统。该仿真系统集成九大模块:图像色彩处理、图像合成、几何变换、灰度变化、平滑处理、边缘锐化处理、形态学处理、分割及测量和变换域处理等内容,包含了各类图像处理算法,涵盖了数字图像处理大部分的基础知识。

图像处理系统界面如图1-26所示,仿真系统界面含有Windows窗口、提示语、运行按钮、以章命名的菜单项、各章对应算法的子菜单项、子菜单项消息映射响应函数、处理前及处理后的图像显示等要素。系统界面中间部分包含左右两个图片对象,左边图片对象来自系统自带的图像、应用者选择的图像或者摄像头拍摄的图像,右边图片对象是用某一种算法处理后的图像;通过左右对比,可加深了解算法的原理,进一步掌握算法的应用。界面上部添加了菜单对象,菜单顶层对应各章的算法主题;具体的菜单选项对应某种图像处理算法,通过回调(CallBack)函数实现功能。该系统形象直观地展示了算法的处理效果,并可以扩展和改进,具有很好的实用性和应用性。

图1-26 图像处理系统界面示意图

2.数字图像处理系统

一般数字图像处理系统含有图像处理、图像分析以及图像识别理解三个层次。图像处理是指对输入图像进行变换,改善图像的视觉效果或增强某些特定信息,是从图像到图像的处理过程。这类处理技术有去噪、增强、锐化、色彩处理、复原等。图像分析是指通过对图像相关目标进行检测、分割、特征提取和测量,获取某些客观信息,从而建立对图像的描述,以便对图像内容进行识别、辨识;图像分析是从图像到非图像(数据或字符)的处理过程,这类处理技术包括图像分割、图像描述和分析等。图像识别理解是指根据从图像中提取出的数据,利用模式识别的方法和理论理解图像内容,提供客观世界的信息,指导和规划行为,其处理过程和方法与人类的思维判断有类似之处。

3.深度学习基础

深度学习是机器学习的一个分支,其核心思想是通过构建深层神经网络来模拟人类神经系统,并从训练数据中提取出高层次的抽象特征。深度学习通常采用反向传播算法进行训练,其核心是最小化代价函数(即网络预测结果与真实结果之间的差异)。深度学习有很多应用领域,如图像识别、自然语言处理、语音识别和推荐系统等。

假设需要用深度学习来分类图像,可以先将图像输入深度神经网络中,网络将逐层进行计算,最终输出一组数值,表示图片属于某个分类的概率。此时引入代价函数,将网络输出与真实结果之间的偏差最小化,让网络自动调整权重,从而提高识别的准确性。比如,最常用的卷积神经网络(Convolutional Neural Network,CNN)在进行图像识别时,它利用卷积和池化等特殊的学习方式,对图像进行特征提取,从而识别出图像中的对象和场景。

深度学习引入了端到端学习的概念,即从输入图像到识别类别的三个层次在一个模型框架内完成。深度学习模型是基于给定数据“训练”得到的,训练集中的每张图像均需标注目标类别,由神经网络发现图像类别中的底层模式,并自动提取出对目标类别最具描述性和最显著的特征。深度神经网络学得的特征是对应特定训练数据的。也就是说,如果训练数据集的构建出现问题,则网络对训练数据集以外的图像处理效果不好。在面对一个图像工程应用时,需要确定选择哪种解决方案。例如,对两类产品进行分类,一类是红色一类是蓝色,深度神经网络需要首先收集充足的训练数据。然而,在训练样本不足的情况下,使用简单的色彩阈值方法也能达到同样的效果。可见,利用传统的图像处理技术来解决问题更加简单、快捷。

4.图像处理与深度学习技术相结合

随着计算机技术的迅猛发展,图像处理和深度学习技术也得到了极大的发展。这两个技术都有着各自的优势和应用领域,但是将图像处理与深度学习技术进行结合,可以得到更加优秀的图像处理结果。经典算法成熟、透明,且为性能和能效进行过优化;深度学习扩展了数字图像处理的边界,可以提供更好的准确率和通用性,但消耗的计算资源也更大。将图像处理和深度学习技术相结合的方法兼具二者的优点,尤其适用于需要快速实现的高性能系统。

本书通过汉字识别、语音识别、手势识别三个普遍应用的项目案例,介绍了图像处理和深度学习技术相结合的应用技术。其中,针对汉字识别项目案例,先使用传统的图像处理算法进行预处理,包括图像的灰度化、二值化、腐蚀、膨胀、投影分割等操作,再使用深度学习算法进行特征提取和分类。针对语音识别项目案例,先使用传统的语音处理算法进行预处理,包括语音信号分帧、预加重、提取语音信号的MFCC特征等操作,按照帧的时间顺序和特征值转换成二维图像,再使用深度学习算法进行特征提取和分类。在这些项目中,先使用传统的处理算法进行预处理,再使用深度学习算法进行特征提取和分类,提高了识别的准确率,达到了更快的处理效果。 aMl5TZCiL0DMpUYATyTqGKqNb0WnN2UnwdWVX4VWpjYVohGNsdhUe6g2D+pVs3Bb

点击中间区域
呼出菜单
上一章
目录
下一章
×