03-矩阵与线性变换#
线性变换#
你可以把它理解成一种函数,即意味着有输出和输入,输入一个向量,输出一个向量,中间的计算,即变换过程体现了向量的运动规律.
特征#
- 直线在变换后依旧是直线 (包裹向量构成的对角线)
- 原点位置不变
- 网格线保持平行且等距分布
线性变换
非线性变换
案例#
我们可以通过数值来描述线性变换
原始基向量: \( \hat{i} = \begin{bmatrix} 1 \\ 0 \end{bmatrix} , \hat{j} = \begin{bmatrix} 0 \\ 1 \end{bmatrix} \)
考虑坐标为 (-1, 2) 的向量 \(\vec{V}\) 时:
$$ \vec{v} = -1 \hat{i} + 2 \hat{j} = -1 \begin{bmatrix} 1 \\ 0 \end{bmatrix} + 2 \begin{bmatrix} 0 \\ 1 \end{bmatrix} = \begin{bmatrix} -1 \\ 2 \end{bmatrix} $$
如果运用一些变换,基向量会和向量 \(\vec{v}\)一起运动
变换后的基向量:\(\hat{i}’ = \begin{bmatrix} 1 \\ -2 \end{bmatrix}, \hat{j}’ = \begin{bmatrix} 3 \\ 0 \end{bmatrix}\)
$$ \vec{v}’ = -1 \hat{i}’ + 2 \hat{j}’ = -1 \begin{bmatrix} 1 \\ -2 \end{bmatrix} + 2 \begin{bmatrix} 3 \\ 0 \end{bmatrix} = \begin{bmatrix} -1 \cdot 1 + 2 \cdot 3 \\ -1 \cdot (-2) + 2 \cdot 0 \end{bmatrix} = \begin{bmatrix} 5 \\ 2 \end{bmatrix} $$
由此得出,我们可以通过\(\hat{i}’\)和\(\hat{j}’\)来推断\(\vec{v}\)变换后的落脚点
一个二维线性变换仅由四个数字完全确定,也就是变换后的\(\hat{i}’\)和\(\hat{j}’\)的坐标,通常我们将这些坐标包装在一个 2X2 的格子中,称它为 2X2 矩阵,只需输入一个向量\(\begin{bmatrix} -1 \\ 2 \end{bmatrix}\), 我们就可以通过\(\begin{bmatrix} 1 & 3 \\ -2 & 0 \end{bmatrix}\)得到变换后的向量\(\begin{bmatrix} 5 \\ 2 \end{bmatrix}\)
公式#
$$ \begin{bmatrix} a & b \\ c & d \end{bmatrix} \begin{bmatrix} x \\ y \end{bmatrix} = x \begin{bmatrix} a \\ c \end{bmatrix} + y \begin{bmatrix} b \\ d \end{bmatrix} = \begin{bmatrix} ax + by \\ cx + dy \end{bmatrix} $$
常用矩阵#
逆时针旋转 90° \(\begin{bmatrix} 0 & -1 \\ 1 & 0 \end{bmatrix}\)
剪切 \(\begin{bmatrix} 1 & 1 \\ 0 & 1 \end{bmatrix}\)
列线性相关 \(\begin{bmatrix} 2 & -2 \\ 1 & -1 \end{bmatrix}\) (意味着其中一个向量是另一个向量的倍数)
04-矩阵乘法与线性变换复合#
复合变换#
核心定义:是多个线性变换的有序组合,通过追踪基向量的最终位置记录变换过程
计算示例:先旋转 (矩阵 R = \(\begin{bmatrix} 0 & -1 \\ 1 & 0 \end{bmatrix}\)) 再剪切 (矩阵 S = \(\begin{bmatrix} 1 & 1 \\ 0 & 1 \end{bmatrix}\)), 复合矩阵 S·R = \(\begin{bmatrix} 1 & -1 \\ 1 & 0 \end{bmatrix}\)
顺序规则 : 矩阵乘法从右向左读 (如 f(g(x))), 源于函数复合的顺序逻辑
矩阵乘法计算#
设 \(M_1\) = \(\begin{bmatrix} 1 & -2 \\ 1 & 0 \end{bmatrix}\), \(M_2\) = \(\begin{bmatrix} 0 & 2 \\ 1 & 0 \end{bmatrix}\)
基向量\(\hat{i}’\)的路径:\(M_1\) 的 \(\hat{i}’\) 经 \(M_2\)变换:
1 X \(\begin{bmatrix} 0 \\ 1 \end{bmatrix}\) + 1 X \(\begin{bmatrix} 2 \\ 0 \end{bmatrix}\) = \(\begin{bmatrix} 0 & 2 \\ 1 & 0 \end{bmatrix}\) = \(\begin{bmatrix} 0 + 2 \\ 1 + 0 \end{bmatrix}\) = \(\begin{bmatrix} 2 \\ 1 \end{bmatrix}\)
基向量\(\hat{j}’\)的路径:\(M_1\) 的 \(\hat{j}’\) 经 \(M_2\)变换:
(-2) X \(\begin{bmatrix} 0 \\ 1 \end{bmatrix}\) + 0 X \(\begin{bmatrix} 2 \\ 0 \end{bmatrix}\) = \(\begin{bmatrix} 0 & 0 \\ -2 & 0 \end{bmatrix}\) = \(\begin{bmatrix} 0 + 0 \\ -2 + 0 \end{bmatrix}\) = \(\begin{bmatrix} 0 \\ -2 \end{bmatrix}\)
复合矩阵:\(\begin{bmatrix} 2 & 0 \\ 1 & -2 \end{bmatrix}\)
通用公式#
\(M_2\) = \(\begin{bmatrix} a & b \\ c & d \end{bmatrix}, M_1 = \begin{bmatrix} e & f \\ g & h \end{bmatrix}\) \(M_2M_1\) = \(\begin{bmatrix} ae + bg & af + bh \\ ce + dg & cf + dh \end{bmatrix}\)
运算性质#
- 不满足交换律:\(M_1M_2\) ≠ \(M_2M_1\)
- 满足结合律:(AB)C = A(BC)
三维空间中的扩展#
基向量增加:引用 Z 轴方向的基向量 \(\hat{k}’\) 坐标 \(\begin{bmatrix} 0 \\ 0 \\ 1 \end{bmatrix}\)
线性变换由\(\hat{i}’, \hat{j}’, \hat{k}’\)变换后的位置决定
向量变换计算规则与二维相同
\(M_1 \vec{v}\) = x \(\begin{bmatrix} a \\ b \\ c \end{bmatrix}\) + y \(\begin{bmatrix} d \\ e \\ f \end{bmatrix}\) + z\(\begin{bmatrix} g \\ h \\ i \end{bmatrix}\)
05-行列式#
行列式的几何本质#
行列式描述线性变换对空间体积或面积的缩放比例
正负号代表空间是否反转
右手定理#
我们通常使用右手定理,即指向前方的无名指代表 \(\hat{i}’\) 指向侧边的中指代表 \(\hat{j}’\) 指向上方的拇指代表 \(\hat{k}’\) 如果用左手表示这个空间,说明空间取向翻转,行列式为负
特殊情况#
行列式 = 0: 空间被压缩至低维
行列式 = 1: 保持体积不变
公式#
$$ \det \begin{bmatrix} a & b \\ c & d \end{bmatrix} = ad - bc $$
ad: 表示基向量缩放后形成的矩形面积
bc: 表示平行四边形沿对角线方向拉伸或压缩了多少
案例#
$$ \det(M_1M_2) = \det(M_1) \cdot \det(M_2) $$
假设对单位正方形进行变换,M1 为放大 2 倍,M2 为放大 4 倍,
\(\det(M_1M_2)\) 可以理解为先放大 4 倍再放大 2 倍,即 1 x (4 x 2),
\(\det(M_1) \cdot \det(M_2)\) 可以理解为 1 x 2 x 4,
两者相等
06-逆矩阵,列空间与零空间#
线性方程组#
线性方程组是指包含若干未知量和相关方程的集合,每个方程中的未知量仅有常系数,并且这些未知量之间只进行加法运算.这类方程组可以统一表示为向量方程:
例子:
$$ \begin{cases} 2x + 5y + 3z = -3 \\ 4x + 0y + 8z = 0 \\ 1x + 3y + 0z = 2 \end{cases} $$
可写成矩阵形式:
$$ \begin{bmatrix} 2 & 5 & 3 \\ 4 & 0 & 8 \\ 1 & 3 & 0 \end{bmatrix} \begin{bmatrix}x \\ y \\ z\end{bmatrix} = \begin{bmatrix}-3 \\ 0 \\ 2\end{bmatrix} $$
其中,左侧矩阵为 \(A\), 未知向量为 \(X\), 右侧为 \(V\), 即 \(AX = V\).
逆矩阵的概念#
- 逆矩阵 \(A^{-1}\) 可以理解为"还原"变换的工具.
- 如果 \(AX = V\) 那么 \(X = A^{-1}V\) 即通过逆矩阵可以解出原始的未知数.
- 只有当 \(A\) 是方阵且 \(\det(A) \neq 0\) 时,逆矩阵才存在.
- 如果矩阵把空间"压缩"了 (降维), 逆矩阵就不存在.
- 特殊情况:如果降维后,某个向量正好落在目标空间上,这个向量可以被逆变换还原.
术语解释#
- 秩 (Rank): 空间变换后的维度.变换后是一维,秩为 1; 二维,秩为 2; 以此类推.
- 列空间 (Column Space): 所有可能的输出向量集合,即 \(Av\) 构成的空间,由矩阵 \(A\) 的列向量张成.
- 张成空间 (Span) 与列空间的区别:
- span 指任意向量集合的线性组合的所有可能结果,column space 是矩阵与任意向量相乘后所有可能结果的集合.
- span 可应用于任意向量集合,column space 与线性方程组 \(Ax = v\) 的解存在性直接相关.
- 满秩:秩与列数相等.
- 零向量:坐标为 (0, 0) 的向量.满秩时,零向量是原点; 非满秩时,有多个向量变成零向量.
- 零空间/核 (Null Space/Kernel): 变换后落在原点的所有向量的集合.
6-补充说明 非方阵#
- 非方阵是指行数和列数不相等 (\(m \neq n\)) 的矩阵.
- 例如:
- \(\begin{bmatrix}2 & -1 & 2 \\ 0 & 1 & 1\end{bmatrix}\): 2 行 3 列,表示从三维空间映射到二维空间 (如三维空间中的点被投影到一个平面上).
- \(\begin{bmatrix}3 & 1 \\ 1 & 5 \\ 4 & 9\end{bmatrix}\): 3 行 2 列,表示从二维空间映射到三维空间 (如二维平面上的点被拉伸到三维空间).
- \(\begin{bmatrix} 1 \ 2 \end{bmatrix}\): 1 行 2 列,表示从二维空间映射到一维空间 (如二维空间中的点被压缩到一条线上).