购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

CHAPTER 3
第3章
深度学习应用

研制智能计算系统的目的是让机器更好地理解和服务人类。人类主要靠视觉、听觉、触觉、嗅觉、味觉的感知来理解世界(其中视觉和听觉尤为重要)。而对于机器来说,完成视听觉的理解,主要是靠深度学习技术。本书的驱动范例——图像风格迁移使用的也是深度学习技术。

本章首先介绍最基本的适合图像处理的卷积神经网络,在此基础上,介绍应用于图像分类和目标检测的代表性卷积神经网络。之后,本章将介绍如何利用神经网络自动生成新的图像,包括生成对抗网络和扩散模型,这些新算法也带来了许多有趣的应用。图像处理主要用卷积神经网络,而语音、文字、视频等序列信息主要用循环神经网络及其改进版本——长短期记忆模型,这些内容将在3.2节介绍。随后,本章会介绍近年来比较热门的大模型技术,包括大模型的核心技术,以及将大模型应用于自然语言处理和图像处理的代表性新算法。在此基础上,本章将介绍用于训练深度神经网络的优化方法和降低深度神经网络计算复杂度和存储开销的量化技术。最后,本章将具体介绍如何用深度学习实现图像风格迁移这一驱动范例。 nn6+mQz9P3X4UECNrVVj8WT+xR2gJhn8b0PtTquYN7vm73D4mSK0e/dIEBRYOATi

点击中间区域
呼出菜单
上一章
目录
下一章
×