在线性代数中,对于一个给定的方阵 A ,它的特征向量 υ 经过矩阵 A 线性变换的作用之后,得到的新的向量仍然与原来的 υ 保持在同一条直线上,但其长度或方向也许会改变。即
其中, λ 为标量,即特征向量的长度在矩阵 A 线性变换下缩放的比例,称为矩阵 A 的 特征值 。
首先来看线性变换,假设有一个二维矩阵 A 与一个向量 υ a ,其中,
用矩阵 A 左乘以 υ a ,根据矩阵的乘法法则,可得
从 υ a 到 A υ a 的过程称为线性变换,如图3.2.1(a)所示。向量 υ a 经过矩阵 A 线性变换后,长度发生了改变,而且不再和原向量保持在一条直线上。
图3.2.1 向量的线性变换
再来考虑另一个向量 υ b =[1,1] T ,对它进行同样的通过矩阵 A 的线性变换,可得
式(3.2.5)说明通过矩阵 A 线性变换后, A υ b = λ υ b =2 υ b 。如图3.2.1(b)所示,经过变换后的新向量与原向量在一条直线上,但是长度发生了改变。根据定义, υ b 是矩阵 A 的特征向量,缩放比例 λ =2则是矩阵 A 对应于特征向量 υ b 的特征值。
现在以矩阵 A 为例,说明如何求解特征值与特征向量。根据式(3.2.2),可得
其中, I 为单位矩阵,维度与 A 相同。根据矩阵理论,如果式(3.2.6)有非零解,则矩阵( A - λ I )的行列式必须为零,即
将
代入式(3.2.7),可得
即
式(3.2.8b)称为矩阵 A 的 特征方程 (Characteristic Equation)。可以得到矩阵 A 的两个特征值:
将式(3.2.9)代入式(3.2.6)即可得到不同特征值所对应的特征向量。例如,当 λ 1 =2时,对应的特征向量为 v 1 =[ v 11 , v 12 ] T ,根据式(3.2.6),可得
式(3.2.10)说明特征向量 υ 1 存在于 v 11 = v 12 这一条直线上。可以任意取其中的一组,例如选取 v 11 = v 12 =1,那么矩阵 A 对应于特征值 λ 1 =2的特征向量为
υ 1 通过矩阵 A 的线性变换后得到 A υ 1 =[2,2] T =2 υ 1 ,如图3.2.1(b)所示。
同理,可以计算 υ 2 ,即特征值 λ 2 =-3时的特征向量,可得
选取 v 21 =0.5, v 22 =-2。那么,矩阵 A 对应于特征值 λ 2 =-3的特征向量为
此时,
。