购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

1.2.2 数字图像处理基础

本书关注的是深度学习在计算机视觉领域的应用,因此下面对数字图像处理的基础知识进行简单阐述。

1.直方图

图像中的直方图用来表示数字图像中的亮度分布,对像素灰度值进行统计就能得到直方图,研究者可以观察直方图来了解图像的整体灰度值分布。在直方图中,左侧为较暗的区域,右侧为较亮的区域。

图1.8所示的两幅子图分别是图1.7中灰度图和彩色图对应的直方图。

我们可以看到,灰度图直方图包含两个很明显的分布,彩色图直方图的红色通道[见图1.8(b)中实线]也包含左右两个很明显的分布,它们分别对应“前景”和“背景”。

图1.9所示中框出来的就是我们感兴趣的“柿子”,它就是前景,灰度比较高,对应直方图中的灰度高峰。

图1.8 灰度图的直方图与彩色图的直方图

图1.9 图像前景主体

2.边缘

视觉机制和马赫带现象都表明,人眼对不连续的东西是最敏感的,而图像中最常见的不连续的东西就是图像边缘。

边缘检测在计算机视觉与图像处理中较基础且应用广泛。可以通过提取目标的轮廓来识别不同的物体,并且将其作为图像的特征表示。传统的边缘检测方法有很多,可以将它们划分为两类:基于一阶导数的方法和基于二阶导数的方法。

边缘检测主要有以下几种代表性的方法。

(1)Roberts算子:这是一种最简单的算子,它采用对角线方向相邻两像素之差作为梯度幅值来检测边缘;Roberts算子对垂直边缘的检测效果好于斜向边缘,定位精度高,对噪声敏感,无法抑制噪声的影响。

(2)Prewitt算子:这是一种一阶微分算子,它利用像素点上下、左右邻点的灰度差进行检测,可去掉部分伪边缘,对噪声具有一定的平滑作用,但容易出现多像素宽度。

(3)Sobel算子:它是基于一阶导数的边缘检测算子,该算子中引入了类似局部平均的运算,因此对噪声具有一定的抑制能力;Sobel算子对像素位置的影响做了加权,相比之下比Prewitt算子、Roberts算子效果更好。

(4)Laplacian算子:这是一种二阶微分算子,二阶微分在图像亮的一侧是负的,在暗的一侧是正的,所以边缘点就是过零点;Laplacian算子对噪声比较敏感,因此只适用于无噪声图像;它容易丢失部分边缘方向信息,造成一些不连续的检测边缘;在存在噪声的情况下,使用Laplacian算子检测边缘之前需要先进行低通滤波。

(5)Canny算子:其效果比以上的算子效果更好,但实现起来步骤最复杂,一般首先要经过降噪处理,将原始图像和高斯平滑模板做卷积,得到一个比较模糊的图像,这个操作平滑了像素噪声;然后使用4个掩模分别检测每个点的水平、垂直和对角线的梯度,获取每个点的亮度梯度图和梯度方向;最后根据上一步获取的梯度图,使用双阈值方法跟踪连续的曲线边缘;Canny算子的优点是对噪声不敏感,缺点是在用高斯函数对图像进行平滑处理的过程中会使高频边缘被平滑掉,从而造成边缘丢失。

图1.10所示为Sobel算子和Canny算子对图1.7中柿子的边缘检测结果,Canny算子的高、低阈值分别是300、100。

图1.10 Sobel算子和Canny算子边缘检测结果

3.对比度

图像有高亮度也有低亮度,对应的就是白与黑,目前多数显示系统利用8字节进行存储,即灰度值0代表最黑,灰度值255代表最亮,不过大部分图像上的亮度范围通常都小于灰度最大值与最小值之差。这里的最大值与最小值之差就是对比度,从视觉上来看就是画面的明暗反差程度。

对比度有全局对比度和局部对比度之分。增加对比度,画面中亮的地方会更亮,暗的地方会更暗,明暗反差会增强。图1.11所示为对比度变化示例,可以看到,降低对比度后明处和暗处的反差减小,增加对比度后,明处和暗处的反差增大。

图1.11 对比度变化示例

常用的对比度调整方法有线性拉伸变换、伽马变换、直方图均衡化等。

1)线性拉伸变换

线性拉伸变换采用线性函数对图像的灰度值进行变换,将灰度值拉伸到0~255的整个区间,通常采用的函数是 ,其中, x min x max 分别是原始图像的极小灰度值和极大灰度值。

2)伽马变换(Gamma Transform)

伽马变换采用非线性函数(指数函数)对图像的灰度值进行变换,使输出图像灰度值与输入图像灰度值呈现指数关系。输入图像灰度值 r 和输出图像灰度值 s 之间的关系为 s=cr γ

不同的伽马系数 γ 变换效果不同,如图1.12所示。当 γ< 1时,伽马变换可以实现原始较暗图像的灰度值提升,如图1.13所示。

图1.12 伽马变换在不同伽马系数下的变换曲线

图1.13 当 γ 小于等于1时,不同 γ 系数下的变换结果

通过伽马变换本质上是对感兴趣的图像灰度进行展宽,对不感兴趣的图像灰度进行压缩,从而实现图像增强的效果。

3)直方图均衡化

直方图均衡化通常用来增加图像的全局对比度,尤其是当图像中主体和背景对比度相当接近时。直方图均衡化的效果就是让直方图更均衡地分布,这种方法对于背景和前景都太亮或太暗的图像(通常是曝光过度或曝光不足的图片)非常有用。

直方图均衡化还是可逆操作,如果已知均衡化函数,还可以恢复原始的直方图,并且计算量不大。这种方法的一个缺点是它对处理的数据不加选择,可能会增加背景噪声的对比度并降低有用信号的对比度。比全局直方图均衡算法更好的是局部直方图均衡算法,它可以更好地增强图像的局部细节,局部直方图均衡算法依据选取子块的不同有所不同。

4.清晰度

清晰度是指边缘附近的灰度对比。如果增加清晰度,边缘较暗的一侧会变得更暗,边缘较亮的一侧会变得更亮,物体轮廓会更加清晰,不过如果清晰度调节过度,会使边缘附近出现晕影。可以通过锐化来增加清晰度;可以通过降低图像分辨率、增加模糊等方法来降低清晰度。图1.14所示分别为高清晰度图和低清晰度图。

图1.14 高清晰度图和低清晰度图

5.数字图像处理与计算机视觉的联系

计算机视觉与数字图像处理的学科基础理论相似,在技术和应用领域也有很大一部分重叠。

数字图像处理系统的输入是图像,输出也是图像。它是针对像素级的操作,如提高图像对比度、边缘提取、去噪声和几何变换等。数字图像处理实现的是图像的某种增强和变换,并没有产生更高层次的理解。计算机视觉系统的输入是图像,输出则是模式识别的结果,它是对图像内容的抽象层级的理解。因此,两者对图像的理解层次不同,数字图像处理注重底层图像变换,而计算机视觉注重高层感知。 rWPwl5MpiaPYvPZxXMDo5RHhhl/Zd7ikU2f8L+T+bes9AvFspN8eW7nnGkKTacst

点击中间区域
呼出菜单
上一章
目录
下一章
×

打开