线性代数——向量、矩阵与核心概念

线性代数解释了向量、矩阵和线性变换是如何运作的。如果你在找线性代数入门知识，核心思想其实很简单：它研究由多个分量组成的量，以及如何按照一致的规则把它们组合或变换。

“线性”这个词很重要，因为它让结果具有可预测性。如果一个规则是线性的，那么输入相加，输出也会按同样的方式相加；输入放大多少倍，输出也会按同样的倍数放大。

用通俗语言理解向量和矩阵

向量是一个按顺序排列的数字列表。在实际问题中，向量可以表示位置、速度、一组测量值，或者某个问题中的系数。

例如，这是一个 $2$ 维向量：

\begin{bmatrix} 2 \\ -1 \end{bmatrix}

矩阵是一个长方形排列的数字数组。矩阵可以用来存储系数、表示一个方程组，或者作为一种规则，把一个向量变换成另一个向量。

这是一个 $2 \times 2$ 矩阵：

\begin{bmatrix} 1 & 2 \\ 0 & 3 \end{bmatrix}

这两者的区别要分清：向量是一个数学对象，而矩阵通常用来组织规则，或把规则作用到向量上。

线性代数中的“线性”是什么意思

在线性代数里，“线性”不只是“看起来像一条直线”。它的意思是，一个规则同时满足加法和数乘。

如果 $T$ 是一个线性变换，那么对向量 $u$ 、 $v$ 和标量 $c$ ，有

T(u + v) = T(u) + T(v)

并且

T(cu) = cT(u)

正是这两个条件，让矩阵变得非常有用。用矩阵做乘法，可以用一种紧凑的方式来描述恰好具有这种性质的变换。

根据这个定义，还能快速得到一个结论：任何线性变换都会把零向量映射到零向量。像 $T(x) = x + 1$ 这样的规则就不满足这一点，所以在线性代数里它不是线性的。

你最先需要掌握的核心概念

标量是一个单独的数，向量是一列数，矩阵是一个数字数组。把这些角色混淆，是初学者最常见的错误之一。

线性组合

线性组合是先把向量做数乘，再把结果相加得到的。例如， $2u - 3v$ 就是 $u$ 和 $v$ 的一个线性组合。

这个概念很重要，因为很多问题最后都可以归结为一个判断：目标向量能不能由你手头已有的向量组合出来？

矩阵作为变换

当矩阵乘以一个向量时，它会用固定的系数把这个向量的各个分量重新组合起来。这就是为什么矩阵常常被描述为一种变换。

线性方程组

像下面这样的方程组

\begin{aligned} x + 2y &= 5 \\ 3x - y &= 4 \end{aligned}

可以写成矩阵形式。线性代数为你提供了解这个方程组的工具，也能帮助你判断它是有唯一解、无解，还是有无穷多解。

例题：矩阵乘向量

取矩阵

A = \begin{bmatrix} 1 & 2 \\ 0 & 3 \end{bmatrix}

和向量

v = \begin{bmatrix} 4 \\ 1 \end{bmatrix}.

要计算 $Av$ ，就用矩阵的每一行去乘这个向量：

Av = \begin{bmatrix} 1 & 2 \\ 0 & 3 \end{bmatrix} \begin{bmatrix} 4 \\ 1 \end{bmatrix} = \begin{bmatrix} 1 \cdot 4 + 2 \cdot 1 \\ 0 \cdot 4 + 3 \cdot 1 \end{bmatrix} = \begin{bmatrix} 6 \\ 3 \end{bmatrix}.

输出是一个新的向量，它的每个分量都是输入分量的线性组合。这里，第一个输出分量是 $1 \cdot 4 + 2 \cdot 1 = 6$ ，第二个是 $0 \cdot 4 + 3 \cdot 1 = 3$ 。

所以，这个矩阵把输入向量映射成了

\begin{bmatrix} 6 \\ 3 \end{bmatrix}.

这就是矩阵乘向量的基本模式：输出向量中的每一个分量，都是由矩阵的一行构造出来的。

线性代数中的常见错误

把矩阵乘法当成对应位置相乘

矩阵乘法通常不是把对应位置上的数直接相乘。它使用的是“行乘列”的组合方式，所以结构非常重要。

忽略维度

只有当矩阵的列数和向量的分量个数相等时，矩阵和向量才能相乘。如果维度不匹配，这个乘积就没有定义。

以为每个方程组都恰好有一个解

这只在某些条件下才成立。有些线性方程组没有解，有些则有无穷多个解。

过于宽泛地使用“线性”这个词

一个规则看起来简单，并不代表它就是线性的。像 $x^2$ 这样的项、像 $xy$ 这样的乘积，或者像 $x + 1$ 这样的常数平移，都会破坏线性。

线性代数基础用在哪里

只要一个问题涉及多个相互关联的量，以及系统地作用于它们的规则，线性代数就会出现。

它被用于计算机图形学中的旋转和投影、工程中的方程组、物理中的状态模型，以及数据科学中的矩阵方法。

你不需要先学很深的理论，也能从基础内容中受益。只要你理解了向量、矩阵和矩阵乘向量，后面的很多主题都会容易得多。

试一道类似的题

试着计算

\begin{bmatrix} 2 & 1 \\ 1 & 0 \end{bmatrix} \begin{bmatrix} 3 \\ 2 \end{bmatrix}.

然后想一想，输出向量中的每个分量分别表示什么。如果这个例子你已经理解了，不妨自己换一个不同的 $2 \times 2$ 矩阵，看看输出会怎样变化。

需要解题帮助？

上传你的问题，几秒钟内获得经过验证的分步解答。

打开 GPAI Solver →