购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

1.4 AI生成大流行

2022年,是人工智能生成内容(AIGC)爆火“出圈”的一年,从AI生成绘画到AI生成代码,再到AI创作的文艺作品,人们惊叹于AI生成的内容,因为这已经不输于人类创作的水平。而2022年末诞生的ChatGPT更是把AIGC推向一个新的高潮。美国《科学》杂志发布的2022年度科学十大突破中,AIGC作为人工智能领域的重要突破赫然在列。Gartner将AlGC列为2022年五大影响力技术之一。《麻省理工科技评论》也将AlGC列为2022年十大突破性技术之一,甚至将AIGC称为Al领域过去十年最具前景的进展。

1.4.1 AIGC爆火“出圈”

什么是AIGC?实际上,AIGC是一个组合词:AI+GC,意思是用人工智能生产内容(AI Generated Content)。从内容创作方式来看,我们曾经听到的大多是PGC和UGC。其中,PGC是指专业内容生产者来生产内容。比如,一个研究并制作出高质量科技评测视频的网站,就可以被称为PGC。在互联网时代,PGC在向大众传播信息方面发挥了重要作用。UGC是指用户生成内容,这些内容不是由专业内容生产者制作的,而是由普通用户自行制作的。比如,在社交媒体上发布的照片、评论和视频等就属于UGC内容。在移动互联网时代,UGC成了主流的内容生产方式。

现在,AIGC正在以迅雷之势成为继PGC和UGC之后新型的内容创作方式。要知道,不管是PGC还是UGC,都是以人为主体进行内容生成和创作的,而AIGC内容的制作方从人或机构变成了AI。

其实AIGC的概念并非在2022年才出现。此前,类似于微软“小冰”等人工智能,作诗、写作、创作歌曲等产品生产就属于AIGC的领域。但直到2022年,随着一幅AI绘画的获奖,AIGC开始集中爆发。

2022年8月,在美国科罗拉多州举办的数字艺术家竞赛中,一幅名为《太空歌剧院》的画作获得数字艺术类别冠军。这一画作由AI绘图工具Midjourney完成:画面上,几位演员穿着华美戏服,站在舞台上表演,黑暗中的观众席上方出现一个巨大圆窗,似乎能看到另一个未知世界的存在。这一AI作品,在世界范围内引发热烈讨论,“AI画作拿一等奖惹怒人类艺术家”的话题很快登上热搜,仅单日阅读量就超过了1.1亿人次。

2022年10月,Stability Al获得约1亿美元融资,估值高达10亿美元,跻身独角兽公司行列。Stability Al发布的开源模型Stable Diffusion,可以根据用户输入的文字描述自动生成图像,即文生图(Text-to-Image,T2I)。Stable Diffusion、Dall-E 2、MidJourney等可以生成图片的AIGC模型引爆了AI作画领域。AI作画风行一时,标志着人工智能向艺术领域渗透。

在AIGC图像生成火爆的同时,ChatGPT横空出世,与人类“对答如流”,将人机对话推向新的高度。体验过的用户纷纷被ChatGPT强大的功能折服,它不仅可以轻松与人类进行各个领域的对话,还能理解各式各样的需求,无论是写代码还是创作小说,甚至给推特的发展提建议、质疑不正确的假设、拒绝不合理的要求等。

可以说,2022年后,AIGC正式进入发展的快车道。现在,全球各大科技企业都在积极拥抱AIGC,不断推出相关的技术、平台和应用。

1.4.2 AIGC大展身手

无论是火遍全网的AI绘画,还是快速吸引用户的ChatGPT,都属于AIGC这一概念,AIGC不仅在图像生成、文本生成领域大展身手,在短视频、动画、音乐等领域同样有非常广阔的前景。

首先,图像生成是AIGC目前发展势头最猛、落地产品更多的领域。根据使用场景,可分为图像编辑和端到端图像生成。图像编辑包括图像属性编辑和图像内容编辑。端到端图像生成包括基于图像生成,如基于草图生成完整图像,根据特定属性生成图像等,以及多模态转换,如根据文字生成图像等。典型的产品或算法模型包括EditGAN、Deepfake、Dall-E、Midjourney、Stable Diffusion、“文心·一格”等。

其次就是AI文本生成。AI文本生成是AIGC中发展最早的一部分技术。根据使用场景,可分为非交互式文本生成和交互式文本生成。非交互式文本生成包括内容续写、摘要/标题生成、文本风格迁移、整段文本生成、图像生成文字描述等功能。交互式文本生成包括聊天机器人、文本交互游戏等功能。典型的产品或算法模型有JasperAI、Copy.ai、彩云小梦、AI Dungeon、ChatGPT等。

AI视频生成可分为视频编辑,如画质修复、视频特效、视频换脸等,以及视频自动剪辑和端到端视频生成,如文字生成视频等。谷歌旗下的文字生成视频AI系统Phenaki就是一个典型应用。虽然Phenaki生成的视频画质还比较差,但时长2分钟的内容已经涉及多个场景、不同主题的变换。正如Phenaki官网所展示的一段视频,其根据一段由200个单词构成的提示词,生成了一段关于未来科幻世界的视频。随着AI与短视频的连接与日俱增,短视频平台的内容池里,除传统的UGC和PGC外,AIGC将占更高的比例,且流量号召力不容小觑。

AI音频生成中的部分技术已经较为成熟,被应用于多种C端产品中。音频生成可分为语音合成(Text-to-speech,TTS)和乐曲生成两类。其中,TTS具有语音客服、有声读物制作、智能配音等功能。乐曲生成包括基于开头旋律、图片、文字描述、音乐类型、情绪类型等生成特定乐曲。典型的产品或算法模型有DeepMusic、WaveNet、Deep Voice、MusicAutoBot等。

此外,AI生成还包括代码生成、游戏生成、3D生成等。今天,AI生成已经步入了春天,可以预见,作为数字内容的新生产方式,AIGC的渗透率还将逐步提升,应用场景日益丰富,包括游戏、动漫、传媒等行业。根据Gartner预测,到2025年,人工智能生成数据占比将达到10%。2022年9月,红杉资本发布的文章 Generative AI A Creative New World 的分析则显示,AIGC有潜力产生数万亿美元的经济价值。

1.4.3 内容生产的全新变革

如果说AI推荐算法是内容分发的强大引擎,那么,AIGC就是数据与内容生产的强大引擎。

传统创作中,创作主体人类往往被认为是权威的代言者,是灵感的所有者。事实上,正是因为人类激进的创造力、非理性的原创性,甚至是毫无逻辑的慵懒,而非顽固的逻辑,才使得到目前为止,机器仍然难以模仿人的这些特质,使得创造性生产仍然是人类的专属。但今天,随着AIGC的出现与发展,创作主体的属人特性被冲击,艺术创作不再是人的专属。即便是模仿式创造,AI对艺术作品形式风格的可模仿能力的出现,都使创作者这一角色的创作不再是人的专利。

AIGC还朝着效率和品质更高、成本更低的方向发展。从社交媒体到游戏、从广告到建筑、从编码到平面设计、从产品设计到法律、从营销到售后等各个需要人类知识创造的行业都可能被AIGC所影响和变革。数字经济和人工智能发展所需的海量数据也能通过AlGC技术生成、合成出来,即合成数据。

今天,AIGC正在掀起一场内容生产的革命。在内容需求旺盛的当下,AIGC所带来的内容生产方式变革引起了内容消费模式的变化。比如,Al绘画可以提高美术素材的生产效率,在游戏、数字藏品领域初步得以应用。

再如,火遍全网的ChatGPT正是典型的文本生成式AlGC。ChatGPT不仅能够满足与人类进行对话的基本功能,还可以驾驭各种风格的文体,且代码编辑能力、基础脑力工作处理能力等一系列常见文字输出任务的完成程度也大大超出预期。

概念上似乎更广泛的AIGC看起来没有ChatGPT那么火爆,其核心原因还在于两者之间的差异。尽管AIGC的概念更宽泛,但目前的技术更多的只是侧重于语意的图像化理解与生成,这与ChatGPT基于神经网络的类人智能化逻辑有所差异。相比较而言,ChatGPT是人类真正期待的人工智能的样子,即具备类人沟通能力,并且借助于大数据的信息整合成为人类强大的助手。

ChatGPT让我们讨论已久、期待已久的人工智能有了可触感,无论它的技术是不是最先进的,但是它所呈现的模样是符合大家期待的。至于未来,将发展成AIGC包含ChatGPT,还是ChatGPT以更快速的迭代与商业化应用取代AIGC的概念,仍不好下定论。

无论这些技术的概念在未来会如何定义,都意味着,在未来,人类社会一切有规律性、规则性的工作,将被ChatGPT或者比ChatGPT更进一步的AIGC所取代,并且一些创造性工作会加速进入人机交互时代。 x3byoGpv2Ij64tgmcVYtx6/xiXihSrW9gHSwOO2DzFMdsX5LM0IcSs0LNQR2p5fA

点击中间区域
呼出菜单
上一章
目录
下一章
×