



后来又出现了一种新型神经网络架构Transformer。谷歌公司的BERT等判别式AI与OpenAI公司的GPT等生成式AI,都建立在Transformer的基础上,其强大的性能促使众多研究者投身于Transformer的研究,使得生成式AI的性能突飞猛进,直至今天的水平。
生成式AI的“生成”指的是创造并构成新事物,与以往的结构大相径庭,它具备补全缺少的数据、产出新内容的能力。
你是否听说过“回归直线”?这是最基本的统计手段之一,用两个变量(自变量和因变量)表示数据的趋势。
举个例子,我们用一张图描绘某企业从2000年到2025年的发展,设定销售额逐年递增。如果把图上的各个黑点按顺序连接起来,会形成一条锯齿状的折线,不过我们可以根据点的位置变化趋势画一条直线,这就是回归直线。
回归直线,表示数据趋势的最基本的统计手段之一
除了可以观察整体趋势之外,回归直线还有另一个优势:能够把欠缺的部分补充出来。
若我们想分析26年间的数据,那么原本需要26个黑点与年份对应,呈现在图上。然而,即便数据少了3条,只要根据趋势画出回归直线,缺少的点也会随之显现。这正是填补缺失数据的“预测”过程,在创造原来不存在的东西这个意义上,相当于所谓“生成”。
假设我们知道2020年、2021年、2022年、2024年的销售额数据,但缺少2023年的数据,此时绘制一条回归直线,就可以推测(内插)2023年的销售额,还能进一步预估(外推)2025年、2026年等未来年份的销售额。
回归直线的强大之处在于,它既可以补全缺失的数据,又能创造出原本没有的数据。生成式AI亦是如此。
如果向生成式AI发出指令“请用夏目漱石风格的文体改写这篇文章”,它就会生成具有夏目漱石风格的文章;若要求它“生成夏目漱石变成猫的图片”,它也能创作出带有夏目漱石特征的猫咪图像。这便是“生成”的过程。
人类可以创作出具有原创性的文字、图像等,而AI也有能力“生成”,可以说AI已经接近人类了。