特征值和特征向量告诉你:对于一个方阵,哪些方向只会被缩放,而不会被“转向”。对于方阵 AA,如果存在一个非零向量 vv 满足

Av=λvAv = \lambda v

其中 λ\lambda 是某个标量,那么 vv 就是特征向量,λ\lambda 就是特征值。若你只想抓住核心思想,那就是:特征向量保持所在直线不变,而特征值告诉你沿这条直线的缩放倍数。

大多数向量在矩阵作用下都会改变方向。特征向量不会。它可能被拉长、缩短,或者当 λ<0\lambda < 0 时发生反向,但它始终留在同一条直线上。

Av=λvAv = \lambda v 的含义

可以把矩阵看成一种变换。通常它会产生旋转、错切、拉伸,或者把不同方向混合起来。但有些方向在这种变换下不会偏离原来的直线。

这些特殊方向就是特征向量。特征值说明矩阵沿这个方向做了什么:

  • 如果 λ>1\lambda > 1,向量被拉伸。
  • 如果 0<λ<10 < \lambda < 1,向量被压缩。
  • 如果 λ<0\lambda < 0,向量会被缩放并反向。
  • 如果 λ=0\lambda = 0,矩阵会把这个特征向量映到零向量。

零向量永远不算特征向量。如果允许它,那么每个矩阵都会有它,这个概念也就失去意义了。

如何求特征值和特征向量

Av=λv.Av = \lambda v.

开始。

把所有项移到一边:

(AλI)v=0.(A - \lambda I)v = 0.

这是一个齐次线性方程组。要让它有非零解 vv,矩阵 AλIA - \lambda I 必须是奇异矩阵,因此

det(AλI)=0.\det(A - \lambda I) = 0.

解这个方程就能得到特征值。然后,对每个特征值,再解

(AλI)v=0(A - \lambda I)v = 0

就能得到对应的特征向量。

这种方法适用于方阵。如果矩阵不是方阵,那么标准形式下的特征值问题就没有定义。

例题:一个 2x2 矩阵

A=[2103].A = \begin{bmatrix} 2 & 1 \\ 0 & 3 \end{bmatrix}.

我们先求特征值,再求与之对应的特征向量。

第 1 步:计算 det(AλI)\det(A - \lambda I)

先写出

AλI=[2λ103λ].A - \lambda I = \begin{bmatrix} 2 - \lambda & 1 \\ 0 & 3 - \lambda \end{bmatrix}.

现在求它的行列式:

det(AλI)=(2λ)(3λ).\det(A - \lambda I) = (2 - \lambda)(3 - \lambda).

令行列式等于零:

(2λ)(3λ)=0.(2 - \lambda)(3 - \lambda) = 0.

所以特征值为

λ=2λ=3.\lambda = 2 \quad \text{和} \quad \lambda = 3.

第 2 步:求 λ=2\lambda = 2 时的特征向量

λ=2\lambda = 2 代入 (AλI)v=0(A - \lambda I)v = 0

A2I=[0101].A - 2I = \begin{bmatrix} 0 & 1 \\ 0 & 1 \end{bmatrix}.

v=[xy]v = \begin{bmatrix} x \\ y \end{bmatrix}。则

[0101][xy]=[00]\begin{bmatrix} 0 & 1 \\ 0 & 1 \end{bmatrix} \begin{bmatrix} x \\ y \end{bmatrix} = \begin{bmatrix} 0 \\ 0 \end{bmatrix}

由此得到 y=0y = 0。变量 xx 是自由变量,所以 xx 轴上的任意非零向量都可以。一个简单的选择是

[10]\begin{bmatrix} 1 \\ 0 \end{bmatrix}

它的任意非零倍数也都是 λ=2\lambda = 2 的特征向量。

第 3 步:求 λ=3\lambda = 3 时的特征向量

现在取 λ=3\lambda = 3

A3I=[1100].A - 3I = \begin{bmatrix} -1 & 1 \\ 0 & 0 \end{bmatrix}.

[1100][xy]=[00].\begin{bmatrix} -1 & 1 \\ 0 & 0 \end{bmatrix} \begin{bmatrix} x \\ y \end{bmatrix} = \begin{bmatrix} 0 \\ 0 \end{bmatrix}.

这给出 x+y=0-x + y = 0,所以 y=xy = x。一个简单的选择是

[11]\begin{bmatrix} 1 \\ 1 \end{bmatrix}

它的任意非零倍数也都是 λ=3\lambda = 3 的特征向量。

第 4 步:验证一组结果

λ=3\lambda = 3 时的 v=[11]v = \begin{bmatrix} 1 \\ 1 \end{bmatrix}

Av=[2103][11]=[33]=3[11].Av = \begin{bmatrix} 2 & 1 \\ 0 & 3 \end{bmatrix} \begin{bmatrix} 1 \\ 1 \end{bmatrix} = \begin{bmatrix} 3 \\ 3 \end{bmatrix} = 3 \begin{bmatrix} 1 \\ 1 \end{bmatrix}.

所以验证成立:Av=3vAv = 3v

直观理解:为什么这些向量很特殊

如果你把平面想象成被 AA 变换,大多数箭头都会倾斜到新的方向。特征向量则是少数仍然留在自己那条直线上的箭头。

这就是它们重要的原因。它们揭示了隐藏在变换内部的简单方向,而这通常比盯着矩阵元素本身更有用。

求特征值和特征向量时的常见错误

  1. 忘记特征向量必须是非零向量。
  2. 错误地求解 det(AλI)=0\det(A - \lambda I) = 0,尤其是在计算行列式这一步。
  3. 求出了特征值,却没有继续求对应的特征向量。
  4. 误以为每个方阵都有足够多的线性无关特征向量来构成一组基。其实有些矩阵没有。
  5. 误以为每个实矩阵都有实特征值。这取决于具体矩阵。

特征值和特征向量的应用

只要一个线性过程存在优先方向或自然模态,它们就会出现。

常见例子包括微分方程、振动问题、动力系统、马尔可夫模型和主成分分析。它们在不同领域中的具体含义会变化,但模式是一样的:寻找那些使变换表现为简单缩放的方向。

试着做一道类似的题

对下面这个矩阵重复同样的过程:

[4011].\begin{bmatrix} 4 & 0 \\ 1 & 1 \end{bmatrix}.

先求特征值,再求特征向量,并通过直接相乘验证其中一组结果。如果你想再进一步,可以把你自己的版本放进求解器里,比较得到的特征对,而不只是最后的数值。

需要解题帮助?

上传你的问题,几秒钟内获得经过验证的分步解答。

打开 GPAI Solver →