购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

前言

在当今数字化与信息化的时代,图像和音视频产品几乎每时每刻都充斥在人们的周围,不管是拍照分享自己的日常生活,还是与亲友视频通话或者与同事进行电话会议,抑或是在影视网站欣赏影视作品,这些图像、视频服务为人们提供了视觉感官的享受与精准的信息传达。与此同时,对画质效果及图像质量的需求也促进了画质算法与图像处理算法的迅速发展。为了更好地满足用户的期望,人们需要深入研究图像背后的基本机制和原理,并通过设计合适的算法创造出更加清晰、真实并令人满意的视觉体验。

随着人工智能和计算机视觉技术的发展,图像处理和画质算法技术的发展也进入了一个新时期。与受到大众关注较多的检测、识别类视觉任务不同,底层视觉任务较少关注对图像内容的理解或推理,而主要关注图像的成像质量与效果,如图像的噪声、颜色、清晰度等。由于深度学习模型拥有强大的归纳和学习能力,所以基于其的底层视觉算法在很多场景下已经可以实现很多传统算法无法达到的效果。本书将带领读者由浅入深地探索图像画质算法和底层视觉技术的基础原理及其应用,较为全面地介绍这个领域的经典方案及最新发展。本书将深入剖析不同任务的定义、难点与处理思路、领域内的经典算法。在算法介绍上,本书力图兼顾传统方法与深度学习方法,主要是考虑到传统方法在很多实际场合中还在发挥重要作用,并且其设计思路往往和任务的先验设定更加相关,另外,在设计深度学习模型时往往借鉴传统方法的思路。因此,分析传统方法对于深入理解底层视觉任务是至关重要的。同时,对于一些相对较新的基于深度学习的算法,本书也会选取其中思路比较有启发性的算法进行介绍,以帮助读者在有需要的时候明确算法的设计和改进方向。

本书结构与主要内容

本书共分为8章。

第1章主要介绍本书所界定的底层视觉任务的定义、基本涵盖范围,以及它与其他视觉任务的主要区别。

第2章主要介绍不同画质相关任务的一些基础知识,如成像过程、图像的颜色和影调及其影响因素、图像的空间操作、频域分析等内容。这些知识是后续所有底层视觉算法的基础,在算法设计中起到重要的作用。

第3章主要介绍去噪算法。去噪算法是底层视觉任务的一个重要分支,它对图像的观感和视觉效果有着重要的影响。本章从噪声的生成机制与基本模型出发,分别介绍了经典的图像处理去噪方法,以及经典的深度学习去噪模型。

第4章主要介绍超分辨率算法。超分辨率算法也是底层视觉任务的一个重要分支,它的目的在于消除画质的退化,提升图像或视频的清晰度。本章从传统的插值与基于稀疏编码的超分辨率算法讲起,重点介绍了基于深度学习的超分辨率的各种处理策略,包括对模型结构的改进和对处理流程的设计。

第5章主要介绍图像去雾算法。本章从雾天成像的退化模型入手,分析了有雾图像的特点及去雾任务的解决方法,重点讲解了几种经典的传统方法,如暗通道先验去雾算法,并介绍了几种不同思路的深度学习去雾模型。

第6章主要介绍图像的HDR任务及其算法。本章首先介绍HDR的定义及HDR相关任务设定,然后介绍几种经典的HDR相关算法,包括传统算法及基于网络模型的经典算法。

第7章主要介绍深度学习的图像合成与图像和谐化。图像合成也是底层视觉处理技术的一个重要任务,其目的是对不同图像的主体和背景进行合成,并使整图观感自然、无瑕疵。本章首先介绍图像合成的传统方法,然后介绍对基于神经网络的合成图像和谐化任务的定义、处理难点、相关模型思路。

第8章主要介绍图像增强与图像修饰。图像增强和图像修饰是比较宽泛的任务类型,包括图像的曝光调整(如低光增强)、颜色调整(如颜色滤镜模拟、色域调整)等子任务。本章介绍了图像增强的一些经典算法,以及基于神经网络模型的图像增强的相关尝试。

参考资料与读者交流

本书中实现的各类算法及模型结构的相关代码和脚本均可以通过作者的GitHub仓库获得,仓库地址:https://github.com/jzsherlock4869/lowlevel-book-codebase。另外,作者水平有限,如果发现书中有技术性错误或者表述不严谨的地方,可以通过在上述代码仓库中提issue的方式留言讨论。后续会收集确需修改的内容,在该仓库维护一个勘误表供读者参考。另外,对于本书内容和形式,读者如有任何想法或建议,也可直接发邮件给作者进行讨论(作者邮箱:jzsherlock@163.com)。

本书读者

本书主要面向的读者群体包括深度学习与计算机视觉行业的从业人员,计算机、人工智能及其相关专业方向的学生,图像处理相关技术的爱好者与学习者。虽然本书已力求通俗和基础,但是仍希望读者在阅读本书之前具有一定的先修知识,包括Python编程基础知识、简单的高等数学和矩阵论知识,并对深度学习有一定的了解。当然,也可以在阅读本书的过程中遇到问题时,有针对性地查阅相关资料作为补充。

致谢

本书讲解了大量的经典算法和比较前沿的网络模型方案,在算法实现过程中也参考了相关论文与官方代码等资料,在此对各位论文作者与研究者的出色工作表示感谢。本书主要的参考文献可以扫描如下的二维码或者封底二维码查看,对相关算法感兴趣的读者可以自行阅读、深入了解。

另外,本书的出版要特别感谢电子工业出版社博文视点的编辑黄爱萍和刘博,两位老师在选题策划及稿件审校方面为作者提供了很多专业建议和帮助,在此真诚致谢,这本图书是我们共同的作品。

最后,还要感谢翻开并阅读这本书的你,希望你可以在从本书中获得相关知识和技术的同时,收获一些对计算机视觉和图像处理领域的启发。祝阅读愉快! Tm2KEbP2DtKl04IDvaDj6aijHvg705RF2C2lnE0AX04jukY6nZ1brPQcRU1mQeXa

点击中间区域
呼出菜单
上一章
目录
下一章
×