线性代数解释了向量、矩阵和线性变换是如何运作的。如果你在找线性代数入门知识,核心思想其实很简单:它研究由多个分量组成的量,以及如何按照一致的规则把它们组合或变换。
“线性”这个词很重要,因为它让结果具有可预测性。如果一个规则是线性的,那么输入相加,输出也会按同样的方式相加;输入放大多少倍,输出也会按同样的倍数放大。
用通俗语言理解向量和矩阵
向量是一个按顺序排列的数字列表。在实际问题中,向量可以表示位置、速度、一组测量值,或者某个问题中的系数。
例如,这是一个 维向量:
矩阵是一个长方形排列的数字数组。矩阵可以用来存储系数、表示一个方程组,或者作为一种规则,把一个向量变换成另一个向量。
这是一个 矩阵:
这两者的区别要分清:向量是一个数学对象,而矩阵通常用来组织规则,或把规则作用到向量上。
线性代数中的“线性”是什么意思
在线性代数里,“线性”不只是“看起来像一条直线”。它的意思是,一个规则同时满足加法和数乘。
如果 是一个线性变换,那么对向量 、 和标量 ,有
并且
正是这两个条件,让矩阵变得非常有用。用矩阵做乘法,可以用一种紧凑的方式来描述恰好具有这种性质的变换。
根据这个定义,还能快速得到一个结论:任何线性变换都会把零向量映射到零向量。像 这样的规则就不满足这一点,所以在线性代数里它不是线性的。
你最先需要掌握的核心概念
标量是一个单独的数,向量是一列数,矩阵是一个数字数组。把这些角色混淆,是初学者最常见的错误之一。
线性组合
线性组合是先把向量做数乘,再把结果相加得到的。例如, 就是 和 的一个线性组合。
这个概念很重要,因为很多问题最后都可以归结为一个判断:目标向量能不能由你手头已有的向量组合出来?
矩阵作为变换
当矩阵乘以一个向量时,它会用固定的系数把这个向量的各个分量重新组合起来。这就是为什么矩阵常常被描述为一种变换。
线性方程组
像下面这样的方程组
可以写成矩阵形式。线性代数为你提供了解这个方程组的工具,也能帮助你判断它是有唯一解、无解,还是有无穷多解。
例题:矩阵乘向量
取矩阵
和向量
要计算 ,就用矩阵的每一行去乘这个向量:
输出是一个新的向量,它的每个分量都是输入分量的线性组合。这里,第一个输出分量是 ,第二个是 。
所以,这个矩阵把输入向量映射成了
这就是矩阵乘向量的基本模式:输出向量中的每一个分量,都是由矩阵的一行构造出来的。
线性代数中的常见错误
把矩阵乘法当成对应位置相乘
矩阵乘法通常不是把对应位置上的数直接相乘。它使用的是“行乘列”的组合方式,所以结构非常重要。
忽略维度
只有当矩阵的列数和向量的分量个数相等时,矩阵和向量才能相乘。如果维度不匹配,这个乘积就没有定义。
以为每个方程组都恰好有一个解
这只在某些条件下才成立。有些线性方程组没有解,有些则有无穷多个解。
过于宽泛地使用“线性”这个词
一个规则看起来简单,并不代表它就是线性的。像 这样的项、像 这样的乘积,或者像 这样的常数平移,都会破坏线性。
线性代数基础用在哪里
只要一个问题涉及多个相互关联的量,以及系统地作用于它们的规则,线性代数就会出现。
它被用于计算机图形学中的旋转和投影、工程中的方程组、物理中的状态模型,以及数据科学中的矩阵方法。
你不需要先学很深的理论,也能从基础内容中受益。只要你理解了向量、矩阵和矩阵乘向量,后面的很多主题都会容易得多。
试一道类似的题
试着计算
然后想一想,输出向量中的每个分量分别表示什么。如果这个例子你已经理解了,不妨自己换一个不同的 矩阵,看看输出会怎样变化。