AI视频生成：原理、工具与应用实践最新章节_袁朝辉著

第3章
AI视频未来展望

AI视频技术正在快速发展，虽然引发了人们对艺术创作力的担忧，但是有许多人认为应正视AI的存在，利用其提升艺术享受，如广东美术馆研究员王嘉。AI视频如《山海奇镜之劈波斩浪》（简称《山海奇镜》）的成功证明了其潜力，但仍存在局限性。随着算法优化和硬件提升，AI视频将更深地融入影视工业，带来降本增效和创意提升。下面从人类如何适应AIGC和AI视频发展的未来两个方面来讲解关于AI视频技术的未来展望。

3.1　人类如何适应AIGC

AI绘画对人类艺术创作力的“摧毁”体现在两个方面：一方面，让艺术从业者无法靠艺术谋生并从心理上摧毁他们对艺术追求的价值认同；另一方面，当人类习惯了快捷易得的艺术创作方式时，就是放弃艺术思考与灵性时，正如人类习惯了键盘与触屏，逐步丧失书写能力一样。

广东美术馆研究员王嘉认为 ^[13] ，人类大可不必担心人工智能的挑战，反而要正视其存在。AI绘画为人类观众提供服务，人类have the last word并享有最终的裁判权，我们还担心什么呢？应该不断提升AI的能力，利用它生成更多的作品，满足人类享用廉价而高质量的艺术盛宴的美好愿望，而非担心它超越人类，这才是“积极的工具论”。人类应有“善假于物也”的万物灵长的自信。

王嘉的另一个观点更加宏大。他认为人类追求科技进步，却没有同步追求观念进步。我们应该改变观念，不应将AI视为“机器美学”，而应该归为“算法美学”。AI应该精进算法，通过硅基载体和二进制逻辑，在生成内容的视觉效果上呈现人性和温情，这才是最为有价值的事情。坚守科技进步最终都要以人文关怀和人文精神为归宿这一理念，“算法美学”才是“真善美”。

最近AI“复活”逝者的新闻让演员陈冲感触很深，她的观点颇具哲思。在她看来，如果AI可以重新生成一个人年轻时的相貌、行为，那么这会不会腐蚀人类对于过去的记忆、进而让人“失去”了自己？另外，她觉得AI最大的危险在于，它对人类的训练一点不比人类对AI的训练少，这是否会导致人类的思维越来越接近AI？

陈冲说了一句充满思辨的总结 ^[9] ：“不是AI替代了我，而是我变得越来越像AI。”

3.2　AI视频发展的未来

2024年7月13日，国内首部AIGC原创奇幻微短剧《山海奇镜》发布。这部被称作“新物种”的纯AI生成的短剧作品广受好评，已经成为AI视频可高质量落地的最新证明。截至7月21日，发布短短8天时间，《山海奇镜》（包括预告片在内）仅在快手平台的播放量已突破4 900万，如图3-1所示。

图3-1　2024年7月21日《山海奇镜》快手平台截图

在《山海奇镜》中，创作者陈坤充分利用了AI视频无限创意的长处。在传统影视中，奇幻和科幻两大赛道因CG特效的高成本和长周期而使发展受限。AI的出现可以让这两种类型的影视创作过程变得高效。《山海奇镜》以《山海经》为创作灵感，出现了较多奇幻场景，利用AI可以轻松生成这些原本需要特效制作的场景。在传统影视中，这些密集的特效场景需要耗费巨资请专业团队进行特效创作。

在《山海奇镜》短剧中，凶兽九婴、异兽鲲鹏、火神祝融、水神共工等山海经记载的上古神兽与人类神祇个个惟妙惟肖、气势磅礴，每一帧都堪比燃烧经费的CG特效。在这些角色出现的镜头中，构图与风格符合审美，大幅度运动符合物理规律，细节细腻逼真，衔接丝滑流畅，除了人物表情略显僵硬，几乎没有什么“AI味”。

制作《山海奇镜》，陈坤仅用了10人小团队和10天时间，他综合采用了多种AI工具，如ChatGPT、Midjourney、DALL-E3与PixVerse。其中，ChatGPT主要用于生成剧本与分镜脚本；Midjourney、DALL-E3用于生成美术设计和分镜关键帧；PixVerse用于将分镜关键帧图片生成视频。

虽然AI视频工具迭代速度非常快，但是在陈坤看来，当下能做的成熟商业交付只有“图生视频”工作流。

从陈坤的AI视频制作经验和深入思考中可以得到以下3条重要经验：

□　充分利用AI视频的长处，定位于科幻、玄幻、动漫3条影视赛道。

□　利用图生图更好地控制AI视频，才能完成商业交付。

□　传统影视制作专家拥有更多技巧，可以更好地完成AI视频制作，而不是某些AI视频工具鼓吹的“人人都能当导演”。

陈坤认为，随着AIGC技术的快速进步，AI视频的可控性、准确度将逐步提升并实现真正的降本增效，从而吸引更多的专业影视工作者使用AI进行内容生产。

同时，AI视频大幅降低了影视动画的创作门槛，就像AI绘画一样，人人都可以进行创作，更多人有机会成为视频内容的生产者。陈坤 ^[14] 认为，AI视频技术的“向下兼容性”更好，但向上对顶级创作者提出的内容要求会更高。

很多看过AI视频的人都会有一个印象，觉得AI生成的内容类似于“片段拼凑”，并且AI味明显。这些缺点可能注定AI视频只能做低端内容。陈坤 ^[14] 认为：“每一种新技术的出现都会开辟新的内容赛道，随之也会诞生新的内容形式和传播方式。这一点是毋庸置疑的。我们已经看到了短视频对长视频的冲击，未来人工智能对传统视频的冲击也是可以预见的。”

总之，AI视频已经冲击着传动影视动画的内容生成方式。Runway和Pika等平台提供了用户友好的交互界面，使无AI操作经验的用户也能快速制作出具有真实感和简单镜头运动的短视频。基于Stable Diffusion视频生成技术为专业用户提供了定制化的工作流程，使他们能够生成多样化风格的视频内容。Sora和Vidu的视频生成质量已达到令人难以辨别真伪的程度，用户仅需要提供文字提示便能生成长时间、物理特性准确的逼真画面 ^[4] 。

但是，目前的AI视频技术仍然存在明显的局限性，以下问题常常令人诟病：

□　不能完全遵守“世界模型”的物理和空间逻辑，生成完全符合常识的场景。

□　生成的有效片段时长通常为数秒，如果时长增加则会导致逻辑或一致性崩坏。

□　镜头变化过大时，画面容易崩坏，如人体动作扭曲、穿模等问题。

□　角色、风格、场景一致性保持困难，需要特殊的技巧进行控图辅助。

□　对算力要求很高，消费级显卡难以运行，生成速度过慢且生成成本过高。

AI视频技术出现不到两年，仍处于初期。但谁也没想到，AI视频几乎每个月都能给人带来惊喜，让人们觉得也许下个月就成熟了。随着算法的不断优化、数据的持续积累以及硬件计算能力的逐步提升，AI视频必将再现“世界模型”物理常识和社会逻辑常识，在一致性、画面细节和可控性上达到商业交付门槛，并更紧密地融入现代影视工业中，显著降本增效并提升创意。

天风证券预测，在短视频、创作工具、游戏等下游领域，可灵、Sora等AI原生产品有望融入工作流，增强用户体验，降低用户使用壁垒，进一步降低创作成本并极大地拓展创作者的能力边界。因此可灵大模型的推出，不仅为用户带来了全新的视频创作体验，也将为短视频行业带来技术革新的机遇。

第3章 AI视频未来展望

3.1 人类如何适应AIGC

3.2 AI视频发展的未来

第3章
AI视频未来展望

3.1　人类如何适应AIGC

3.2　AI视频发展的未来