IBM商业价值报告：生成式AI最新章节_IBM商业价值研究院著

什么是生成式AI？什么是基础模型？

为了提高AI投资的成本效益，企业需要灵活、可重用且支持多种应用方式的模型，包括用于生成新内容。生成式AI是一种深度学习模型，可根据训练数据生成高质量的文本、图像和其他内容。从较高层面来说，生成模型对其训练数据的简化表示进行编码，并从中提取特征信息，以创建与原始数据相似但不相同的新作品。

这项技术于2010年代初开始出现，当时的变分自动编码器（VAE）成为第一个广泛用于生成逼真图像和语音的深度学习模型。自动编码器的工作原理是将未标记的数据编码为压缩表示，然后将数据解码回其原始形式。普通自动编码器可应用于多种用途，包括重建损坏或模糊的图像。变分自动编码器不仅增强了重建数据的关键能力，而且还可以输出原始数据的变化形式。

这种生成新数据的能力引发了一系列新技术的快速发展，从生成式对抗网络（GAN）到扩散模型，这些技术能够生成更加逼真的虚构图像。因此，变分自动编码器为当今的生成式AI奠定了基础。变分自动编码器基于编码器和解码器构建而成，这种架构也是当今大语言模型（LLM）的基础。具体来说，编码器将数据集压缩为密集表示形式，在抽象空间中将相似的数据点排列得更紧密。解码器从这个抽象空间中进行采样以创建新内容，同时保留数据集的最重要特征。

Transformer将“编码器-解码器”架构与文本处理机制相结合。编码器将原始文本转换为“嵌入”表示。解码器将这些嵌入与模型之前的输出相结合，并连续预测句子中的每个单词。通过填空猜谜游戏，编码器可以了解单词与句子之间的关系，而无须任何人标记词性。

基础模型可以帮助企业加速和扩大生成式AI的采用。

Transformer甚至可以在未指定特定任务的情况下进行预训练。学习这些强大的表示之后，就可以使用更少的数据来增强模型的专业化水平，以便执行给定的任务。Transformer因其全面多样的功能而被称为基础模型。

基础模型在理论上可以应用于许多领域，因而提供了加速和扩大生成式AI采用的机会。例如，大规模参数的LLM可以改变整个组织中的信息生成和共享方式。（参数是在训练模型时使用的变量，有助于推断新内容。）只需对LLM进行适当调整，以适应语义搜索、分类、预测、摘要生成和翻译等任务即可。

基础模型的采用还得到了一系列已成为主流的新兴AI工程最佳实践的支持。从模型开发到快速工程，这些通用实践和方法大幅简化了整个企业和生态系统的协作。

尽管基础模型具有无比广阔的前景和潜力，但同时也带来了一些新的挑战。比如说，基础模型需要大量的计算、存储和网络资源，而这会消耗大量能源。训练一个大型自然语言处理模型的碳足迹与五辆汽车在其整个生命周期中的碳足迹大致相同。

与其他颠覆性技术一样，采用生成式AI和基础模型也需要做出适当的权衡。只有经过持续不断的实验和迭代才有可能取得成功。对于企业而言，平衡AI项目所需的投资与其可创造的价值是一项尤其重要的工作。那些能够找到这一平衡点的组织将定义AI的未来。

案例研究

劳埃德银行集团利用大语言模型改善客户服务

当需要财务相关信息时，用户并不希望等待太长时间。但劳埃德银行集团（LBG）的客户在使用其移动应用上的搜索功能时，却无法即时获取所需答案。系统会将他们转至其他沟通渠道，并且需要较长的等待时间才能获取帮助，从而导致服务成本增加以及更加糟糕的客户体验。

由于搜索功能依赖于关键字匹配，因此当客户在最常见的搜索中出现拼写错误时，就会出现问题。为了解决这些问题，IBM使用生成式预训练Transformer嵌入来矢量化常见问题解答，识别适当的响应，并生成综合响应返回给用户。

由数据科学家、用户体验和战略顾问组成的IBM团队正在着手开展以下工作：

构建概念验证，证明大语言模型可以减少不成功搜索的数量、改进虚拟助手集成和个性化搜索响应，从而彻底改善移动应用搜索体验。

概述工业化方法，定义将概念验证转化为供客户部署的解决方案的步骤。该团队正在考虑未来的风险和机遇，将“搜索”打造为所有客户自助服务的入口。

自2017年以来，IBM和LBG一直在定义全新的创新性方法，利用AI来增强客户互动。他们在整个企业范围内使用基础模型和生成式AI模型来了解不断变化的客户需求，并减少管理、训练和执行AI驱动的互动流程所需的手动工作。这让该银行能够轻松获取一些重要数据，否则相关的分析工作将需要花费超过200万英镑的成本和数千小时的人力。