AIGC是指利用人工智能技术生成的内容,包括AI绘画、AI写作、AI作曲等具体形式。在国际上,AIGC对应的术语是“人工智能合成媒体(AI-generated Media/Synthetic Media)”,其定义为通过人工智能算法对数据或媒体进行生产、操控和修改的统称。作为继PGC (Professional-Generated Content,专业生成内容)和UGC(User-Generated Content,用户生成内容)之后的新型内容生产方式,AIGC在2022年展现出惊人的发展速度和指数级的迭代速度。深度学习模型的不断完善、开源模式的推动以及大模型探索商业化的可能,都在助力AIGC的快速发展。2022年,AI绘画作品的夺冠和ChatGPT的出现,拉开了AIGC创作时代的序幕。在人工智能的发展历程中,如何让机器学会创作一直被视为难以逾越的天堑,“创造力”也因此被视为人类与机器最本质的区别之一。然而,人类的创造力也终将赋予机器创造力,这将把世界带入一个智能创作的新时代。
根据《人工智能生成内容(AIGC)白皮书(2022年)》中的研究,AIGC的发展历程可以分为三个阶段,即20世纪50年代至90年代中期的早期萌芽阶段、20世纪90年代至21世纪10年代中期的沉淀积累阶段、21世纪10年代中期至今的快速发展阶段。如今,超大规模、超多参数量的多模态大型神经网络正在成为学界和产业界共识,推动AIGC技术不断升级发展,例如Stable Diffusion、OpenAI、DALL·E2、ChatGPT和百度文心等。
图1-1 人工智能发展历程图
尽管计算机早在1957年就已能够创作音乐,但在2022年,AIGC才真正迎来爆发。在这一年上半年,OpenAI发布了DALL·E2,下半年Stable Diffusion面世,AI作画大火。2022年11月底,OpenAI发布ChatGPT,次年2月注册人数突破1亿。2023年3月再次发布的GPT-4将AIGC技术推向了新的高峰。GPT-4对文字超强的理解能力及逆天的跨模态推理分析能力引发了人们对自身工作必要性的怀疑。虽然AIGC在许多现实场景中尚未达到人类的表现水平,但在许多专业和学术基准上则表现出与人类相当的性能,随之而来的是AIGC行业上中下游的各类玩家纷纷入场。图1-2为国内目前AIGC行业内的大模型、不同模态应用层、技术及云服务商等企业玩家,图1-3则是AIGC各类应用场景的技术落地转化率评估。
图1-2 AIGC产业全景图
(资料来源:量子位《AIGC/AI生成内容产业展望报告》)
“AI绘画”作为AIGC大家族中具有代表性的应用之一,利用算法和技术生成图像,可以实现从文本到图像(Text2Image)或从图像到图像(Image2Image)的转换,自动生成具有一定创意及艺术性的图像作品。这种惊人的AI创造能力为从业者在早期概念阶段带来了创意表达的多样性,但另一方面,AI在内容生产领域中的进化速度令创意领域的从业者对未来感到担忧与迷茫。从样本规则、机器学习,再到智能创造,从PGC、UGC到AIGC,我们正在见证一场深刻的生产力变革。这场变革将会把我们引向何方,我们不敢断言,但值得肯定的一点是,它将深刻地改变我们的创意生产方式。接下来,我们会聚焦在AI绘画领域,结合生动的比喻和有趣的案例,带领大家详细了解AI绘画发展历程、技术原理,直面当下行业应用的机遇与挑战,思辨AI绘画的生态与未来。
图1-3 AIGC各类应用场景的技术落地转化率评估
(资料来源:量子位《AIGC/AI生成内容产业展望报告》)
图1-4 AIGC中的AI绘画细分
(资料来源:量子位)