2012年左右,随着可获取的数据量的增加、计算资源成本的降低,以及相关算法的出现,人工智能得到了较大的突破,吸引了各行各业人员的目光。其中,深度学习在计算机视觉上的应用是人工智能成功的主要体现。深度学习在计算机视觉领域展现出了较大的优势,这是由于相比于传统算法,其具有端到端的优势,即它并不是将单独调试的部分拼凑起来组成一个系统,而是将整个系统组建好之后一起训练。伴随着这波热潮,基于深度学习的计算机视觉算法在智能安防、自动驾驶、智慧医疗、手机娱乐App以及精确制导领域得到了广泛的应用。
本书系统全面地介绍了深度学习时代的计算机视觉任务,包括图像分类、目标检测、图像分割、图像目标跟踪、姿态估计、行人重识别、人脸识别和图像超分辨率重建。计算机视觉各项任务之间是可以互相借鉴的,因此将其放在一本书里对于读者快速系统地了解这些算法是非常有帮助的。
本书第1章由李健伟负责,介绍了人工智能、深度学习和计算机视觉等概念;第2章由徐从安和李健伟负责,介绍了基于深度学习的图像分类算法模型;第3章由徐从安和李健伟负责,介绍了基于深度学习的目标检测算法;第4章由李健伟和蔡咪负责,介绍了基于深度学习的图像语义分割算法模型;第5章由徐从安负责,介绍了基于深度学习的人体姿态估计算法;第6章由李健伟和董云龙负责,介绍了基于深度学习的行人重识别和目标跟踪算法;第7章由徐从安和李科健负责,介绍了基于深度学习的人脸识别算法;第8章由孙超和李健伟负责,介绍了基于深度学习的图像超分辨率重建方法。
本书部分内容得到了张杨、迟诚、王黎翔、袁磊、唐浪、杨森、刘竞升和向石方等人的帮助,在此一并表示感谢!
由于作者水平有限,书中难免存在疏漏和不当之处,敬请读者批评指正。
作者
2021年9月于烟台