特征值和特征向量告诉你:对于一个方阵,哪些方向只会被缩放,而不会被“转向”。对于方阵 A,如果存在一个非零向量 v 满足
Av=λv
其中 λ 是某个标量,那么 v 就是特征向量,λ 就是特征值。若你只想抓住核心思想,那就是:特征向量保持所在直线不变,而特征值告诉你沿这条直线的缩放倍数。
大多数向量在矩阵作用下都会改变方向。特征向量不会。它可能被拉长、缩短,或者当 λ<0 时发生反向,但它始终留在同一条直线上。
Av=λv 的含义
可以把矩阵看成一种变换。通常它会产生旋转、错切、拉伸,或者把不同方向混合起来。但有些方向在这种变换下不会偏离原来的直线。
这些特殊方向就是特征向量。特征值说明矩阵沿这个方向做了什么:
- 如果 λ>1,向量被拉伸。
- 如果 0<λ<1,向量被压缩。
- 如果 λ<0,向量会被缩放并反向。
- 如果 λ=0,矩阵会把这个特征向量映到零向量。
零向量永远不算特征向量。如果允许它,那么每个矩阵都会有它,这个概念也就失去意义了。
如何求特征值和特征向量
从
Av=λv.
开始。
把所有项移到一边:
(A−λI)v=0.
这是一个齐次线性方程组。要让它有非零解 v,矩阵 A−λI 必须是奇异矩阵,因此
det(A−λI)=0.
解这个方程就能得到特征值。然后,对每个特征值,再解
(A−λI)v=0
就能得到对应的特征向量。
这种方法适用于方阵。如果矩阵不是方阵,那么标准形式下的特征值问题就没有定义。
例题:一个 2x2 矩阵
设
A=[2013].
我们先求特征值,再求与之对应的特征向量。
第 1 步:计算 det(A−λI)
先写出
A−λI=[2−λ013−λ].
现在求它的行列式:
det(A−λI)=(2−λ)(3−λ).
令行列式等于零:
(2−λ)(3−λ)=0.
所以特征值为
λ=2和λ=3.
第 2 步:求 λ=2 时的特征向量
把 λ=2 代入 (A−λI)v=0:
A−2I=[0011].
设 v=[xy]。则
[0011][xy]=[00]
由此得到 y=0。变量 x 是自由变量,所以 x 轴上的任意非零向量都可以。一个简单的选择是
[10]
它的任意非零倍数也都是 λ=2 的特征向量。
第 3 步:求 λ=3 时的特征向量
现在取 λ=3:
A−3I=[−1010].
解
[−1010][xy]=[00].
这给出 −x+y=0,所以 y=x。一个简单的选择是
[11]
它的任意非零倍数也都是 λ=3 的特征向量。
第 4 步:验证一组结果
取 λ=3 时的 v=[11]:
Av=[2013][11]=[33]=3[11].
所以验证成立:Av=3v。
直观理解:为什么这些向量很特殊
如果你把平面想象成被 A 变换,大多数箭头都会倾斜到新的方向。特征向量则是少数仍然留在自己那条直线上的箭头。
这就是它们重要的原因。它们揭示了隐藏在变换内部的简单方向,而这通常比盯着矩阵元素本身更有用。
求特征值和特征向量时的常见错误
- 忘记特征向量必须是非零向量。
- 错误地求解 det(A−λI)=0,尤其是在计算行列式这一步。
- 求出了特征值,却没有继续求对应的特征向量。
- 误以为每个方阵都有足够多的线性无关特征向量来构成一组基。其实有些矩阵没有。
- 误以为每个实矩阵都有实特征值。这取决于具体矩阵。
特征值和特征向量的应用
只要一个线性过程存在优先方向或自然模态,它们就会出现。
常见例子包括微分方程、振动问题、动力系统、马尔可夫模型和主成分分析。它们在不同领域中的具体含义会变化,但模式是一样的:寻找那些使变换表现为简单缩放的方向。
试着做一道类似的题
对下面这个矩阵重复同样的过程:
[4101].
先求特征值,再求特征向量,并通过直接相乘验证其中一组结果。如果你想再进一步,可以把你自己的版本放进求解器里,比较得到的特征对,而不只是最后的数值。