前言

AIGC（人工智能生成内容）的发展如火如荼，正在快速席卷各行各业。各种新模型层出不穷，基于新模型的新应用场景不断涌现。AI视频生成作为AIGC的重要应用场景正在深刻地影响着人们的日常生活。从自媒体创作到视频制作，从影视创作到动画与动漫创作等，AI视频生成正在不断地重塑相关行业。可以说，AI视频生成因其高效率、低成本、低门槛等特点已经成为自媒体从业者、视频创作者、影视从业者、动画与动漫创作者等必须掌握的基本技能，也正在成为大中专院校影视动画与数字媒体等相关专业的必修课。

为了帮助AIGC从业者全面、系统、深入地学习绘画、语音和视频等生成与处理技术，“可学AI”团队于2023年便开始组织人员筹划相关图书的写作和出版事宜，并于2024年先后出版了《AI绘画大师之道：轻松入门》和《AI绘画全场景案例应用与实践》。这两部图书上市后均获得了广大读者的好评。为了帮助读者更加系统地学习AIGC相关技术，“可学AI”团队经过调研，计划进一步推出《AIGC绘画与音视频生成：ComfyUI工作流应用与实践》《AI语音与音乐生成：原理、工具与应用实践》《AI视频生成：原理、工具与应用实践》《AI绘画模型微调：原理、工具与应用实践》等图书，这些图书组成“AIGC技术探索丛书”供读者阅读。

本书为“AIGC技术探索丛书”中的《AI视频生成：原理、工具与应用实践》分册。本书结合36个应用案例详细介绍AI视频生成的基本原理、主流平台与工具、开源模型、基础操作、场景应用与综合项目实战等。

本书采用全彩印刷，效果精美。书中对一些重点中英文提示词用蓝色突出显示，对一些重点命令用紫色显示，以提高阅读体验。通过阅读本书，读者可以全面、系统、深入地掌握AI视频生成涉及的核心技术、工具、模型、技巧与场景应用等。

本书特色

□　轻松上手：通过“图书+教学视频+拓展学习+答疑解惑”的立体教学方式，带领读者轻松上手。

□　内容全面：涵盖AI视频生成的发展历史、基本原理、工具与平台、开源模型、基础操作、场景应用和项目实战等，涉及25个AI视频类在线平台与工具、27款开源AI视频模型、20种常用ComfyUI工作流，带领读者一站式掌握AI视频生成的核心知识与应用。

□　技术新颖：紧跟技术发展趋势，基于当前的主流工具、平台和模型进行讲解，以确保内容的时效性与准确性。

□　图文并茂：结合300多幅图进行讲解，直观地展现AI视频生成的原理与操作过程。

□　实践性强：详解36个类型丰富、由易到难的经典应用案例，涵盖AI视频生成的常见场景应用，帮助读者快速提高AI视频生成的实际动手能力。

□　举一反三：针对同一功能或场景应用，提供多种实现思路，帮助读者融会贯通，从而达到举一反三的效果。

□　资源超值：提供大量的超值配套学习资源（见后文），帮助读者高效、直观地学习。

□　服务完善：提供QQ书友群、电子邮箱、B站和公众号等多种服务渠道，为读者的学习保驾护航。

本书内容

第1篇 AI视频概述

第1章介绍AI视频技术的发展历史与现状，让读者了解AI视频的发展脉络。

第2章介绍AI视频快速发展带来的冲击，包括AI视频电信诈骗、好莱坞演员罢工和AI视频作品版权等相关内容，让读者了解相应的对策。

第3章介绍人们如何适应AIGC和AI视频发展的未来。

第2篇 AI视频原理

第4章介绍常见的AI视频生成模型，包括变分自编码器、生成对抗网络、扩散模型和自回归模型。

第5章介绍视频扩散模型的相关知识，包括其应用场景、基本框架、生成高清视频的技巧，以及如何保持视频时空一致性和基于多样性数据训练模型。

第6章介绍流行的混合模型DiT的相关知识以及文生视频模型Sora和国产视频生成模型可灵AI的相关知识。

第3篇 AI视频平台、工具与模型

第7章介绍国内外25款在线AI视频平台与工具，包括腾讯智影、秒创、可灵AI、剪映、即梦AI、PixVerse、清影、Vidu、Runway、Pika、HeyGen、Akool、度加创作工具、快手云剪、剪辑魔法师、万彩AI、33搜帧、Q.AI、Fliki等。

第8章介绍开源AI视频模型，包括4款通用类模型、4款图片说话类模型、3款动作引导类模型、3款SD-WebUI插件类模型和3款类Sora知名开源模型。

第9章介绍几款多模态大模型，包括文心一言、通义千问和讯飞星火等。

第4篇 AI视频平台、工具与模型的使用

第10章介绍在线视频平台Runway、Pika和可灵AI的使用方法。

第11章介绍SVD、CogVideo、Animate Anyone和Champ等开源AI视频模型的部署和使用方法。

第12章介绍20个ComfyUI视频工作流的用法，包括4个文生视频工作流、5个图生视频工作流、2个视频风格转绘工作流、5个图片跳舞工作流及4个其他创意应用工作流。

第5篇 AI视频场景应用实战

第13～17章分别介绍让图片动起来、视频换脸、视频转绘、视频重绘和视频编辑5个AI视频的常见场景应用。每个场景应用都通过多个具体案例展示其实现过程与效果，并进行总结和扩展。

第6篇 AI视频项目案例实战

第18章从编写脚本、美术设计、分镜设计、AI绘画出图、视频制作、添加声音和后期制作7个方面展示AI动画制作——复现《门后的世界》项目案例的实现。

第19章从编写脚本、美术设计、分镜设计、AI绘画出图、视频制作、添加声音和后期制作7个方面展示AI文旅视频制作——武汉宣传片项目案例的实现。

读者对象

本书读者对象如下：

□　自媒体从业人员；

□　视频创作人员；

□　影视创作人员；

□　数字人、直播从业者；

□　其他AI视频技术爱好者；

□　高等院校影视动漫、数字媒体等专业的学生和教师；

□　AI视频培训机构的学员。

配套资源获取方式

本书赠送以下超值配套资源：

□　教学视频；

□　案例素材；

□　提示词文件；

□　视频类工作流文件；

□　教学PPT；

□　软件安装文件。

上述配套资源有两种获取方式：一是关注微信公众号“方大卓越”，回复数字“51”自动获取下载链接；二是在清华大学出版社网站（www.tup.com.cn）上搜索到本书，然后在本书页面上找到“资源下载”栏目，单击“网络资源”按钮进行下载。另外，读者也可以在“B站”上查找UP主“可学AI”，在线观看本书配套教学视频。

意见反馈

AI视频正在持续高速发展中，其功能迭代日新月异。虽然本书在写作中已尽力保持内容的时效性与新颖性，但是鉴于技术的快速变化和作者认知的局限性，书中难免存在一些未尽完善之处或细微疏漏，敬请各位读者批评与指正，笔者会及时进行调整和修改，您的宝贵意见是我们不断进步的动力。读者可以通过本书QQ书友群或电子邮箱（bookservice2008@163.com）联系我们，也可关注微信公众号“可学AI”，了解AIGC的相关进展信息。读者也可关注微信公众号“方大卓越”，回复数字“51”自动获取QQ书友群号等信息。

致谢

感谢夏小康、尹子成、白玉棋、张炯涛、朱美霞、秦天琪、王佑琳、肖越汉、张洋和王浩铭等在本书写作期间给予笔者团队的支持与帮助！

感谢欧振旭在本书出版过程中给予笔者的大力支持与帮助！

感谢清华大学出版社参与本书出版的所有人员！是你们一丝不苟的精神，才使本书得以高质量出版。

袁朝辉
2025年5月