购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

2.3 矩阵及其在机器学习中的作用

有时,仅仅将一组数字组合成一个向量还不够,我们需要将多个向量进一步组合成一个更大的组。例如,在训练机器学习模型时,我们有多个输入实例,每个实例都由一系列数字组成。如2.1节所述,属于单个输入实例的数字序列可以构成一个向量。那么,我们应该如何表示所有输入实例的集合呢?这就涉及了数学中的矩阵概念。矩阵可以被视为一个由固定数量的行和列组成的矩形数字数组,其中每一行和每一列都可以看作一个向量。因此,矩阵可以被视为所有行向量或列向量的集合。在此基础上,我们可以用矩阵来表示构成机器学习模型训练输入的所有数字集合,其中每个行向量对应一个训练样本。

我们同样以熟悉的猫脑问题为例。如前所述,机器接收的单个输入实例是一个向量 ,其中 x 0 描述了猫面前物体的硬度。现在,考虑一个包含许多此类输入实例的训练数据集,每个实例都有一个已知的威胁评分输出。在1.1节中我们提到,机器学习的目标是构建一个函数,在尽可能小的总体误差下,将这些输入映射到它们相应的输出结果。我们的训练数据可能如表2.2所示。请注意,在实际问题中,训练数据集通常很大,可能包含数百万个输入/输出对。但在这个示例问题中,我们只有8个训练数据实例。

表2.2 基于机器学习的猫脑模型的训练数据集

从表2.2中,我们可以将对应于硬度和锋利度的列组合到一个矩阵中,如式(2.1)所示。这是对该问题训练数据集的一种紧凑表示

矩阵 X 中的每一行代表一个特定的输入实例。不同的行对应不同的输入实例。另外,不同的列代表不同的特征元素。例如,矩阵 X 的第0行表示第0个输入实例的向量 。其中,元素 x 00 x 01 分别代表该输入实例的两个不同的特征元素,即硬度和锋利度。

数字图像的矩阵表示

数字图像也通常使用矩阵来表示,矩阵中的每个元素代表图像中特定像素位置( x y 坐标)的亮度。通常,这些亮度值被归一化为0到255之间的整数,其中,0表示黑色,255表示白色,而128则表示灰色 。以下展示了一个宽度为9像素、高度为4像素的小图像的矩阵示例:

观察该矩阵,我们可以发现图像的亮度从左到右逐渐增强,从上到下也是如此。 I 00 代表左上角的黑色像素, I 38 代表右下角的白色像素,中间区域的像素则是介于黑白之间的各种灰度。实际的图像如图2.3所示。

图2.3 式(2.2)中矩阵 I 4,9 所对应的图像 yUrfr9P6ap/+GLdA3FJ5vOTh0H06H0duJIr/SuIEglYHV2lvtV0mDfSEdeMZYMXO

点击中间区域
呼出菜单
上一章
目录
下一章
×