线性代数的本质

视频课程：线性代数的本质——3Blue1Brown
文字教程：3Blue1Brown

序言

线性代数是学习任何技术学科都需要掌握的一门科目，但是对于初次学习的同学，他们往往对线性代数的理解十分肤浅，在大学课堂上我们只学习了如何计算机，而不了解为什么要这样，在脑海中没有一个直观的几何图形。因此，我们需要更深入理解线性代数的本质。

线性代数在工学学科中应用十分广泛，如果能够掌握线性代数的本质，对于一般问题，我们很快就能知道使用什么方法，以及答案大概是什么样的。这是因为线性代数中有许多隐藏其中的直观理解，并且这些直观理解与计算有相当直接的联系。在当今这个时代，复杂的问题可以利用计算机进行计算，我们要学习的是更深层次的本质理解。

向量是什么

有三种看待向量的视角：

物理专业学生的视角：有长度和方向的箭头 ${\nearrow}$
计算机专业学生的视角：一个有序数字列表 ${\begin{bmatrix} a \\ b \end{bmatrix}}$
数学家的视角：任何保证相加和数乘有意义的事物 ${\overrightarrow{v}}$

向量加法与向量数乘贯穿线性代数始终，有非常重要的作用。

我们首先关注向量的几何方面，将其看作一个箭头 ${\nearrow}$ 方便我们初期理解。

起点落在原点，${\nearrow}$ ：空间中的箭头，${\begin{bmatrix} 2 \\ 1 \end{bmatrix}}$：有序数字列表（尖端坐标）

有序数字列表中，正数表示向右移动，负数表示向左移动，数字表示移动距离，即从原点 ${\rightarrow}$ 尖端，第 1 个数表示 x 轴方向移动，第 2 个数表示 y 轴，三维空间同理。

向量加法：这是唯一允许向量离开原点的操作

${\begin{bmatrix} 1 \\ 1 \end{bmatrix} + \begin{bmatrix} 2 \\ {-1} \end{bmatrix} = \begin{bmatrix} 3 \\ 0 \end{bmatrix}}$ 可以理解为上下左右移动方向的距离相加之和

向量数乘：伸缩向量

${2\ {\times} \begin{bmatrix} 2 \\ 1 \end{bmatrix} = \begin{bmatrix} 4 \\ 2 \end{bmatrix}}$，2 为标量

线性组合

线性组合，张成的空间与基

$\begin{bmatrix} 2 \\ 1 \end{bmatrix} = 2\ {\times} \begin{bmatrix} 1 \\ 0 \end{bmatrix} + \begin{bmatrix} 0 \\ 1 \end{bmatrix}$，可以看作是先向右移动两个单位，再向上移动一个单位。

此时 $\begin{bmatrix} 1 \\ 0 \end{bmatrix}{\rightarrow}$ 和 $\begin{bmatrix} 1 \\ 0 \end{bmatrix}{\uparrow}$ 共同构成了二维空间中的一组基，因为它们线性组合能表示二维空间中的任何向量。

在用一组基表示空间中任意一个向量的过程中，就利用了向量的数乘和相加。

在二维空间中，只要 2 个向量不共线，都能表示所有的向量，即是二维空间中的一组基。反过来，空间中的一组基张成的空间就是此空间。如 $(1,0)\ (0,1)$ 就张成了一个二维空间。此时可把向量简化成一个点，起点为原点，终点为向量坐标。

同理，在三维空间中，线性无关的三个向量可以张成整个三维空间，这里的线性无关意味着三个向量两两不共面。若第三个向量落在前两个向量张成的平面中，则三个向量就不能张成一个三维空间，此时可称第三个向量与前两个向量线性相关。此外，若其中两个向量共线也无法张成三维空间，这与共面是相同的道理。

若要张成 n 维空间，则需要 n 个线性无关的向量，这 n 个线性无关向量也作为 n 维空间的一组基。

基的定义：向量空间中的一组基就是一个线性无关向量集

线性变换

线性变换，矩阵与空间变换

需要注意的是：列向量 $\overrightarrow{v} = \begin{bmatrix} 1 \\ 0 \end{bmatrix}$ 可以写作 $\overrightarrow{v} = (1, 0)$

变换本质是函数的表达，接收一个向量并输出一个向量变换。空间中的有些变换十分复杂，但是线性变换被约束在一个线性维度。

线性变换要求：①变换后直线不能弯曲；②原点必须保持固定。

简单来讲，就是“网格平行且等距分布”。

如何求出变换后的向量位置：只需要观察一组基的变换过程。比如，在二维空间中记录 $\hat{i} = (1,0)$ 和 $\hat{j} = (0,1)$ 变换前后的坐标，即可确定一种变换，也可推导出任意向量变换后的位置。

举例：

$\overrightarrow{v} = -1 \times \hat{i} + 2 \times \hat{j}$ ${\overset{线性变换}{\longrightarrow}}$ $\hat{v’} = -1 \times \overrightarrow{i’} + 2 \times \hat{j’}$

即 $\overrightarrow{v}$ 依旧用原来的表达式被 $\hat{i}$ 和 $\hat{j}$ 表示。

一个二维线性变换，仅由 4 个数字确定（$\hat{i}=(1,0)$ 和 $\hat{j}=(0,1)$ 变换前后的位置）。比如，一个向量为 $(x,y)$，变换后 $\hat{i}=(1,-2),\ \hat{j}=(3,0)$，则变换后的向量为

$$x \begin{bmatrix} 1 \\ -2 \end{bmatrix} + y \begin{bmatrix} 3 \\ 0 \end{bmatrix} = \begin{bmatrix} x+3y \\ -2x \end{bmatrix}.$$

将 $\hat{i}$ 和 $\hat{j}$ 变换后的坐标合并成一个矩阵就可以表示一种线性变换。若你想要知道一个向量变换后的坐标，则可以利用这个矩阵。比如，向量 $(2,1)$ 通过变换矩阵 $\begin{bmatrix} 1 & 3 \\ -2 & 0 \end{bmatrix}$ 得 $$2 \times\begin{bmatrix}1\\2\end{bmatrix}+1\times\begin{bmatrix}3\\0\end{bmatrix}=\begin{bmatrix}5\\-4\end{bmatrix}，$$ 即为 $(2,1)$ 变换后的坐标，因此，矩阵可以表示一个线性变换。

更一般的，可以表示为 $$\begin{bmatrix}a&b\\c&d\end{bmatrix}\begin{bmatrix}x\\y\end{bmatrix}=x\begin{bmatrix}a\\c\end{bmatrix}+y\begin{bmatrix}b\\d\end{bmatrix}=\begin{bmatrix}ax+by\\cx+dy\end{bmatrix}.$$

由此我们可以得到一些常见的线性变换矩阵：

空间逆时针旋转 90 度：$\begin{bmatrix}0&-1\\1&0\end{bmatrix}$
剪切变换：$\begin{bmatrix}1&1\\0&1\end{bmatrix}$

$\begin{bmatrix}1&3\\2&1\end{bmatrix}$ 所表示的变换是将 $\hat{i}$ 变换到 $(1,2)$，将 $\hat{j}$ 变换到 $(3,1)$，其余向量随着 $\hat{i}$ 和 $\hat{j}$ 的变换而变换。

而 $\begin{bmatrix}2&-2\\1&-1\end{bmatrix}$ 中的 $i$ 和 $j$ 线性相关，只能张成一条直线，无法表示整个二维空间。

综上，矩阵乘法就是计算线性变换作用与定向量的一种途径，每个矩阵都可以看作是空间中的一种变换。矩阵即空间线性变换。

线性变换复合

矩阵乘法与线性变换复合之间的联系

复合变换 = 旋转变换 + 剪切变换