



AIGC(人工智能生成内容)的发展如火如荼,正在快速席卷各行各业。各种新模型层出不穷,基于新模型的新应用场景不断涌现。AI视频生成作为AIGC的重要应用场景正在深刻地影响着人们的日常生活。从自媒体创作到视频制作,从影视创作到动画与动漫创作等,AI视频生成正在不断地重塑相关行业。可以说,AI视频生成因其高效率、低成本、低门槛等特点已经成为自媒体从业者、视频创作者、影视从业者、动画与动漫创作者等必须掌握的基本技能,也正在成为大中专院校影视动画与数字媒体等相关专业的必修课。
为了帮助AIGC从业者全面、系统、深入地学习绘画、语音和视频等生成与处理技术,“可学AI”团队于2023年便开始组织人员筹划相关图书的写作和出版事宜,并于2024年先后出版了《AI绘画大师之道:轻松入门》和《AI绘画全场景案例应用与实践》。这两部图书上市后均获得了广大读者的好评。为了帮助读者更加系统地学习AIGC相关技术,“可学AI”团队经过调研,计划进一步推出《AIGC绘画与音视频生成:ComfyUI工作流应用与实践》《AI语音与音乐生成:原理、工具与应用实践》《AI视频生成:原理、工具与应用实践》《AI绘画模型微调:原理、工具与应用实践》等图书,这些图书组成“AIGC技术探索丛书”供读者阅读。
本书为“AIGC技术探索丛书”中的《AI视频生成:原理、工具与应用实践》分册。本书结合36个应用案例详细介绍AI视频生成的基本原理、主流平台与工具、开源模型、基础操作、场景应用与综合项目实战等。
本书采用全彩印刷,效果精美。书中对一些重点中英文提示词用蓝色突出显示,对一些重点命令用紫色显示,以提高阅读体验。通过阅读本书,读者可以全面、系统、深入地掌握AI视频生成涉及的核心技术、工具、模型、技巧与场景应用等。
□ 轻松上手:通过“图书+教学视频+拓展学习+答疑解惑”的立体教学方式,带领读者轻松上手。
□ 内容全面:涵盖AI视频生成的发展历史、基本原理、工具与平台、开源模型、基础操作、场景应用和项目实战等,涉及25个AI视频类在线平台与工具、27款开源AI视频模型、20种常用ComfyUI工作流,带领读者一站式掌握AI视频生成的核心知识与应用。
□ 技术新颖:紧跟技术发展趋势,基于当前的主流工具、平台和模型进行讲解,以确保内容的时效性与准确性。
□ 图文并茂:结合300多幅图进行讲解,直观地展现AI视频生成的原理与操作过程。
□ 实践性强:详解36个类型丰富、由易到难的经典应用案例,涵盖AI视频生成的常见场景应用,帮助读者快速提高AI视频生成的实际动手能力。
□ 举一反三:针对同一功能或场景应用,提供多种实现思路,帮助读者融会贯通,从而达到举一反三的效果。
□ 资源超值:提供大量的超值配套学习资源(见后文),帮助读者高效、直观地学习。
□ 服务完善:提供QQ书友群、电子邮箱、B站和公众号等多种服务渠道,为读者的学习保驾护航。
第1篇 AI视频概述
第1章介绍AI视频技术的发展历史与现状,让读者了解AI视频的发展脉络。
第2章介绍AI视频快速发展带来的冲击,包括AI视频电信诈骗、好莱坞演员罢工和AI视频作品版权等相关内容,让读者了解相应的对策。
第3章介绍人们如何适应AIGC和AI视频发展的未来。
第2篇 AI视频原理
第4章介绍常见的AI视频生成模型,包括变分自编码器、生成对抗网络、扩散模型和自回归模型。
第5章介绍视频扩散模型的相关知识,包括其应用场景、基本框架、生成高清视频的技巧,以及如何保持视频时空一致性和基于多样性数据训练模型。
第6章介绍流行的混合模型DiT的相关知识以及文生视频模型Sora和国产视频生成模型可灵AI的相关知识。
第3篇 AI视频平台、工具与模型
第7章介绍国内外25款在线AI视频平台与工具,包括腾讯智影、秒创、可灵AI、剪映、即梦AI、PixVerse、清影、Vidu、Runway、Pika、HeyGen、Akool、度加创作工具、快手云剪、剪辑魔法师、万彩AI、33搜帧、Q.AI、Fliki等。
第8章介绍开源AI视频模型,包括4款通用类模型、4款图片说话类模型、3款动作引导类模型、3款SD-WebUI插件类模型和3款类Sora知名开源模型。
第9章介绍几款多模态大模型,包括文心一言、通义千问和讯飞星火等。
第4篇 AI视频平台、工具与模型的使用
第10章介绍在线视频平台Runway、Pika和可灵AI的使用方法。
第11章介绍SVD、CogVideo、Animate Anyone和Champ等开源AI视频模型的部署和使用方法。
第12章介绍20个ComfyUI视频工作流的用法,包括4个文生视频工作流、5个图生视频工作流、2个视频风格转绘工作流、5个图片跳舞工作流及4个其他创意应用工作流。
第5篇 AI视频场景应用实战
第13~17章分别介绍让图片动起来、视频换脸、视频转绘、视频重绘和视频编辑5个AI视频的常见场景应用。每个场景应用都通过多个具体案例展示其实现过程与效果,并进行总结和扩展。
第6篇 AI视频项目案例实战
第18章从编写脚本、美术设计、分镜设计、AI绘画出图、视频制作、添加声音和后期制作7个方面展示AI动画制作——复现《门后的世界》项目案例的实现。
第19章从编写脚本、美术设计、分镜设计、AI绘画出图、视频制作、添加声音和后期制作7个方面展示AI文旅视频制作——武汉宣传片项目案例的实现。
本书读者对象如下:
□ 自媒体从业人员;
□ 视频创作人员;
□ 影视创作人员;
□ 数字人、直播从业者;
□ 其他AI视频技术爱好者;
□ 高等院校影视动漫、数字媒体等专业的学生和教师;
□ AI视频培训机构的学员。
本书赠送以下超值配套资源:
□ 教学视频;
□ 案例素材;
□ 提示词文件;
□ 视频类工作流文件;
□ 教学PPT;
□ 软件安装文件。
上述配套资源有两种获取方式:一是关注微信公众号“方大卓越”,回复数字“51”自动获取下载链接;二是在清华大学出版社网站(www.tup.com.cn)上搜索到本书,然后在本书页面上找到“资源下载”栏目,单击“网络资源”按钮进行下载。另外,读者也可以在“B站”上查找UP主“可学AI”,在线观看本书配套教学视频。
AI视频正在持续高速发展中,其功能迭代日新月异。虽然本书在写作中已尽力保持内容的时效性与新颖性,但是鉴于技术的快速变化和作者认知的局限性,书中难免存在一些未尽完善之处或细微疏漏,敬请各位读者批评与指正,笔者会及时进行调整和修改,您的宝贵意见是我们不断进步的动力。读者可以通过本书QQ书友群或电子邮箱(bookservice2008@163.com)联系我们,也可关注微信公众号“可学AI”,了解AIGC的相关进展信息。读者也可关注微信公众号“方大卓越”,回复数字“51”自动获取QQ书友群号等信息。
感谢夏小康、尹子成、白玉棋、张炯涛、朱美霞、秦天琪、王佑琳、肖越汉、张洋和王浩铭等在本书写作期间给予笔者团队的支持与帮助!
感谢欧振旭在本书出版过程中给予笔者的大力支持与帮助!
感谢清华大学出版社参与本书出版的所有人员!是你们一丝不苟的精神,才使本书得以高质量出版。
袁朝辉
2025年5月