生成式AI实战：基于Transformer、Stable Diffusion、LangChain和AI Agent最新章节_欧阳植昊著

1.2
常见模型介绍

在1.1节中，我们学习了一些常用的技术框架或工具，本节将对常见模型进行介绍。

在机器学习领域，模型大致可以分为两大类——判别式（discriminative）模型和生成式（generative）模型。这两类模型在目标、方法和应用方面都有所不同。

1.2.1 判别式模型

判别式模型的主要任务是学习输入数据和输出标签之间的映射关系。简而言之，它们试图直接从输入数据预测输出标签。判别式模型关注于边界，即不同类别或结果之间的分界线。常见的判别式模型包括逻辑斯谛回归（Logistic Regression，LR）、支持向量机（Support Vector Machine，SVM）、深度神经网络（Deep Neural Network，DNN）等。

1. 逻辑斯谛回归

逻辑斯谛回归是一种广泛使用的线性分类器，主要用于二分类问题。它通过sigmoid函数将线性回归的输出压缩到[0,1]区间，以表示某个类别的概率。

2. 支持向量机

支持向量机是一种强大的分类器，通过寻找最大间隔超平面以最好地分割不同的类别。支持向量机在处理中小型复杂数据集方面表现突出，尤其是在高维空间。如图1-1所示，使用支持向量机对白点、黑点进行分类。

图1-1 支持向量机

3. 深度神经网络

深度神经网络通过组合多个非线性处理层来学习复杂的数据表示。深度神经网络在语音识别、图像识别、NLP等领域取得了巨大成功。

1.2.2 生成式模型

与判别式模型不同，生成式模型试图了解数据是如何生成的。它们通过学习输入数据的分布来生成新的数据实例。生成式模型不仅能够执行分类任务，还能够生成类似于训练集的全新数据样本。常见的生成式模型包括高斯混合模型（Gaussian Mixture Model，GMM）、隐马尔可夫模型（Hidden Markov Model，HMM）和近年来非常流行的生成对抗网络（Generative Adversarial Network，GAN）及扩散模型（Diffusion Model，DM）等。

1. 高斯混合模型

高斯混合模型是一种概率模型，假设所有的数据点都是由有限数量的高斯分布混合生成的。高斯混合模型常用于聚类分析和密度估计。

2. 隐马尔可夫模型

隐马尔可夫模型是一种统计模型，假定系统可以用一个隐藏的马尔可夫链生成观测数据。隐马尔可夫模型广泛应用于时间序列数据的分析，如语音识别和NLP。隐马尔可夫模型的状态变迁如图1-2所示。

图1-2 隐马尔可夫模型的状态变迁

3. 生成对抗网络

生成对抗网络由两部分组成——生成器和判别器。生成器负责产生看起来像真实数据的假数据，而判别器的任务是区分生成的数据和真实数据。生成对抗网络在图像生成、风格转换、图像超分辨率等方面显示出惊人的效果。

4. 扩散模型

扩散模型是一种近年来快速崛起的生成式模型，它通过模拟反向扩散过程来生成数据。这个过程首先从一个随机噪声分布开始，然后逐步通过学习的扩散过程去除噪声，最终生成与真实数据相似的样本。扩散模型在图像和音频合成领域取得了显著成果，尤其是在生成高质量、细节丰富的图像方面表现出色。

生成式模型和判别式模型各有优势及适用场景。判别式模型凭借直接学习输入与输出之间关系的能力，在许多预测和分类任务中表现卓越。而生成式模型则因为能够揭示数据背后的分布特征和生成新数据的能力，在数据增强、未来预测等任务中展现出巨大的潜力。随着研究的深入和技术的发展，两类模型都在不断进化，以解决越来越多的实际问题。

1.2 常见模型介绍