线性代数的本质
Table of Contents
- 视频课程:线性代数的本质——3Blue1Brown
- 文字教程:3Blue1Brown
序言
线性代数是学习任何技术学科都需要掌握的一门科目,但是对于初次学习的同学,他们往往对线性代数的理解十分肤浅,在大学课堂上我们只学习了如何计算机,而不了解为什么要这样,在脑海中没有一个直观的几何图形。因此,我们需要更深入理解线性代数的本质。
线性代数在工学学科中应用十分广泛,如果能够掌握线性代数的本质,对于一般问题,我们很快就能知道使用什么方法,以及答案大概是什么样的。这是因为线性代数中有许多隐藏其中的直观理解,并且这些直观理解与计算有相当直接的联系。在当今这个时代,复杂的问题可以利用计算机进行计算,我们要学习的是更深层次的本质理解。
向量是什么
有三种看待向量的视角:
- 物理专业学生的视角:有长度和方向的箭头 ${\nearrow}$
- 计算机专业学生的视角:一个有序数字列表 ${\begin{bmatrix} a \\ b \end{bmatrix}}$
- 数学家的视角:任何保证相加和数乘有意义的事物 ${\overrightarrow{v}}$
向量加法与向量数乘贯穿线性代数始终,有非常重要的作用。
我们首先关注向量的几何方面,将其看作一个箭头 ${\nearrow}$ 方便我们初期理解。
起点落在原点,${\nearrow}$ :空间中的箭头,${\begin{bmatrix} 2 \\ 1 \end{bmatrix}}$:有序数字列表(尖端坐标)
有序数字列表中,正数表示向右移动,负数表示向左移动,数字表示移动距离,即从原点 ${\rightarrow}$ 尖端,第 1 个数表示 x 轴方向移动,第 2 个数表示 y 轴,三维空间同理。
向量加法:这是唯一允许向量离开原点的操作
${\begin{bmatrix} 1 \\ 1 \end{bmatrix} + \begin{bmatrix} 2 \\ {-1} \end{bmatrix} = \begin{bmatrix} 3 \\ 0 \end{bmatrix}}$ 可以理解为上下左右移动方向的距离相加之和
向量数乘:伸缩向量
${2\ {\times} \begin{bmatrix} 2 \\ 1 \end{bmatrix} = \begin{bmatrix} 4 \\ 2 \end{bmatrix}}$,2 为标量
线性组合
线性组合,张成的空间与基
$\begin{bmatrix} 2 \\ 1 \end{bmatrix} = 2\ {\times} \begin{bmatrix} 1 \\ 0 \end{bmatrix} + \begin{bmatrix} 0 \\ 1 \end{bmatrix}$,可以看作是先向右移动两个单位,再向上移动一个单位。
此时 $\begin{bmatrix} 1 \\ 0 \end{bmatrix}{\rightarrow}$ 和 $\begin{bmatrix} 1 \\ 0 \end{bmatrix}{\uparrow}$ 共同构成了二维空间中的一组基,因为它们线性组合能表示二维空间中的任何向量。
在用一组基表示空间中任意一个向量的过程中,就利用了向量的数乘和相加。
在二维空间中,只要 2 个向量不共线,都能表示所有的向量,即是二维空间中的一组基。反过来,空间中的一组基张成的空间就是此空间。如 $(1,0)\ (0,1)$ 就张成了一个二维空间。此时可把向量简化成一个点,起点为原点,终点为向量坐标。
同理,在三维空间中,线性无关的三个向量可以张成整个三维空间,这里的线性无关意味着三个向量两两不共面。若第三个向量落在前两个向量张成的平面中,则三个向量就不能张成一个三维空间,此时可称第三个向量与前两个向量线性相关。此外,若其中两个向量共线也无法张成三维空间,这与共面是相同的道理。
若要张成 n 维空间,则需要 n 个线性无关的向量,这 n 个线性无关向量也作为 n 维空间的一组基。
基的定义:向量空间中的一组基就是一个线性无关向量集
线性变换
线性变换,矩阵与空间变换
需要注意的是:列向量 $\overrightarrow{v} = \begin{bmatrix} 1 \\ 0 \end{bmatrix}$ 可以写作 $\overrightarrow{v} = (1, 0)$
变换本质是函数的表达,接收一个向量并输出一个向量变换。空间中的有些变换十分复杂,但是线性变换被约束在一个线性维度。
线性变换要求:①变换后直线不能弯曲;②原点必须保持固定。
简单来讲,就是“网格平行且等距分布”。
如何求出变换后的向量位置:只需要观察一组基的变换过程。比如,在二维空间中记录 $\hat{i} = (1,0)$ 和 $\hat{j} = (0,1)$ 变换前后的坐标,即可确定一种变换,也可推导出任意向量变换后的位置。
举例:
$\overrightarrow{v} = -1 \times \hat{i} + 2 \times \hat{j}$ ${\overset{线性变换}{\longrightarrow}}$ $\hat{v’} = -1 \times \overrightarrow{i’} + 2 \times \hat{j’}$
即 $\overrightarrow{v}$ 依旧用原来的表达式被 $\hat{i}$ 和 $\hat{j}$ 表示。
一个二维线性变换,仅由 4 个数字确定($\hat{i}=(1,0)$ 和 $\hat{j}=(0,1)$ 变换前后的位置)。比如,一个向量为 $(x,y)$,变换后 $\hat{i}=(1,-2),\ \hat{j}=(3,0)$,则变换后的向量为
$$x \begin{bmatrix} 1 \\ -2 \end{bmatrix} + y \begin{bmatrix} 3 \\ 0 \end{bmatrix} = \begin{bmatrix} x+3y \\ -2x \end{bmatrix}.$$
将 $\hat{i}$ 和 $\hat{j}$ 变换后的坐标合并成一个矩阵就可以表示一种线性变换。若你想要知道一个向量变换后的坐标,则可以利用这个矩阵。比如,向量 $(2,1)$ 通过变换矩阵 $\begin{bmatrix} 1 & 3 \\ -2 & 0 \end{bmatrix}$ 得 $$2 \times\begin{bmatrix}1\\2\end{bmatrix}+1\times\begin{bmatrix}3\\0\end{bmatrix}=\begin{bmatrix}5\\-4\end{bmatrix},$$ 即为 $(2,1)$ 变换后的坐标,因此,矩阵可以表示一个线性变换。
更一般的,可以表示为 $$\begin{bmatrix}a&b\\c&d\end{bmatrix}\begin{bmatrix}x\\y\end{bmatrix}=x\begin{bmatrix}a\\c\end{bmatrix}+y\begin{bmatrix}b\\d\end{bmatrix}=\begin{bmatrix}ax+by\\cx+dy\end{bmatrix}.$$
由此我们可以得到一些常见的线性变换矩阵:
- 空间逆时针旋转 90 度:$\begin{bmatrix}0&-1\\1&0\end{bmatrix}$
- 剪切变换:$\begin{bmatrix}1&1\\0&1\end{bmatrix}$
$\begin{bmatrix}1&3\\2&1\end{bmatrix}$ 所表示的变换是将 $\hat{i}$ 变换到 $(1,2)$,将 $\hat{j}$ 变换到 $(3,1)$,其余向量随着 $\hat{i}$ 和 $\hat{j}$ 的变换而变换。
而 $\begin{bmatrix}2&-2\\1&-1\end{bmatrix}$ 中的 $i$ 和 $j$ 线性相关,只能张成一条直线,无法表示整个二维空间。
综上,矩阵乘法就是计算线性变换作用与定向量的一种途径,每个矩阵都可以看作是空间中的一种变换。矩阵即空间线性变换。
线性变换复合
矩阵乘法与线性变换复合之间的联系
复合变换 = 旋转变换 + 剪切变换