这是一本系统讲解GAN理论、模型、常见问题,并为视觉和语音领域的大部分应用场景提供GAN解决方案和综合实例的著作。
作者在人工智能领域积累颇深,这本书得到了阿里巴巴达摩院城市大脑前实验室主任华先胜和中国科学院自动化所刘成林的推荐。前4章针对性地讲解GAN的理论,帮助读者夯实基础;后8章讲解应用,用大量经典的模型和9个案例,为8个应用场景提供GAN解决方案。
第1~4章首先介绍了无监督生成模型、显式生成模型、以GAN为代表的隐式生成模型等各种生成模型的理论和原理,然后讲解了GAN中的目标函数及其数学原理、GAN在训练中的常见问题和相应解决方案、GAN的评价指标和可视化等。
第5~12章分别讲解了图像生成GAN的各类模型与应用、图像翻译GAN的各类模型与应用、人脸图像编辑GAN的各类模型与应用、图像质量增强GAN的各类模型与应用、三维图像与视频生成GAN的各类模型与应用、通用的图像编辑GAN框架、对抗攻击以及GAN在其中的应用、GAN在语音信号处理中的实战应用。
全书理论体系完善,GAN的目标优化、训练、评估等内容在同类书中极少提及;内容丰富,循序渐进,覆盖视觉和语音中的绝大部分应用场景;实战性强,9个综合案例,提供案例源代码和解读,以及实验数据和实验结果对比分析;图文并茂,包含大量原创图表,可读性强。