线性代数的本质 - 04

09-基变换
#

我们之前讨论的各种情况,都是在标准基向量 $\hat{i} = \begin{bmatrix} 1 \\ 0 \end{bmatrix}$ 和 $\hat{j} = \begin{bmatrix} 0 \\ 1 \end{bmatrix}$ 定义的坐标系中进行的.

在不同的坐标系中,描述同一个向量的坐标是不同的,这是因为我们选用的基向量发生了改变.

示例
#

假设有另一组基向量 $\hat{i} = \begin{bmatrix} 2 \\ 1 \end{bmatrix}$ 和 $\hat{j} = \begin{bmatrix} -1 \\ 1 \end{bmatrix}$.

在该坐标系中的向量 $\begin{bmatrix} 5/3 \\ 1/3 \end{bmatrix}$, 在我们的标准坐标系中被表示为 $\begin{bmatrix} 3 \\ 2 \end{bmatrix}$.

坐标系变换
#

我们可以将新的基向量构成一个矩阵 $A = \begin{bmatrix} 2 & -1 \\ 1 & 1 \end{bmatrix}$.
用这个矩阵乘一个在其他坐标系下的向量,就能得到它在标准坐标系下的表示.

$$\begin{bmatrix} 2 & -1 \\ 1 & 1 \end{bmatrix}\begin{bmatrix} 5/3 \\ 1/3 \end{bmatrix} = \begin{bmatrix} 3 \\ 2 \end{bmatrix}$$

坐标系逆变换
#

只需取上述矩阵 $A$ 的逆矩阵 $A^{-1}$.
用 $A^{-1}$ 乘一个标准坐标系下的向量,就能得到它在其他坐标系下的表示.

案例
#

如何在两个不同的坐标系中实现相同的变换?(例如逆时针旋转 90°)

假设 $M$ 是标准坐标系下的变换矩阵 (旋转 90°: $M = \begin{bmatrix} 0 & -1 \\ 1 & 0 \end{bmatrix}$).
假设 $A$ 是从其他坐标系到标准坐标系的变换矩阵.
在其他坐标系中实现同样变换的矩阵为 $A^{-1}MA$.

这个操作的直观理解是:

$A$: 将向量从其他坐标系变换到标准坐标系.
$M$: 在标准坐标系中进行旋转.
$A^{-1}$: 将结果变换回原来的坐标系.

对于基向量为 $\begin{bmatrix} 2 \\ 1 \end{bmatrix}$ 和 $\begin{bmatrix} -1 \\ 1 \end{bmatrix}$ 的坐标系,其旋转 90°的变换矩阵为: $A^{-1}MA = \begin{bmatrix} 2 & -1 \\ 1 & 1 \end{bmatrix} \begin{bmatrix} 0 & -1 \\ 1 & 0 \end{bmatrix} \begin{bmatrix} 1/3 & 1/3 \\ -1/3 & 2/3 \end{bmatrix} = \begin{bmatrix} 1/3 & -5/3 \\ 2/3 & -1/3 \end{bmatrix}$

10-特征向量与特征值
#

特征向量 (Eigenvector)
#

在经历矩阵所描述的线性变换时,方向保持不变 (仅在其张成的空间内伸缩) 的非零向量.

特征值 (Eigenvalue)
#

特征向量在变换过程中被###拉伸或压缩的比例因子.

从几何上看,如果一个三维空间的旋转可以被看作是围绕一个轴进行的,那么这个轴的方向向量就是一个特征向量,其对应的特征值为 1 (因为它在旋转中没有被拉伸). 这种理解方式远比一个 3x3 矩阵要直观.

计算方法
#

公式:$A\vec{V} = \lambda\vec{V}$

$A$: 变换矩阵
$\vec{V}$: 特征向量
$\lambda$: 特征值

为了求解,我们将公式变形: $A\vec{V} - \lambda\vec{V} = 0$ $A\vec{V} - \lambda I\vec{V} = 0$ $(A - \lambda I)\vec{V} = 0$

这个结果说明,特征向量 $\vec{V}$ 经过 $(A - \lambda I)$ 变换后,会被压缩成零向量.
这意味着变换 $(A - \lambda I)$ 是一个降维的变换,所以它的行列式必定为零.
$\det(A - \lambda I) = 0$

示例
#

对于矩阵 $A = \begin{bmatrix} 3 & 1 \\ 0 & 2 \end{bmatrix}$: $\det(A - \lambda I) = \det \left( \begin{bmatrix} 3 & 1 \\ 0 & 2 \end{bmatrix} - \lambda \begin{bmatrix} 1 & 0 \\ 0 & 1 \end{bmatrix} \right) = \det \begin{bmatrix} 3-\lambda & 1 \\ 0 & 2-\lambda \end{bmatrix} = (3-\lambda)(2-\lambda) = 0$ 解得特征值 $\lambda = 2$ 或 $\lambda = 3$.

当 $\lambda = 2$ 时,我们求解 $(A - 2I)\vec{V}$ = $\begin{bmatrix} 1 & 1 \\ 0 & 0 \end{bmatrix} \begin{bmatrix} x \\ y \end{bmatrix} = \begin{bmatrix} 0 \\ 0 \end{bmatrix}$ 所有解都在向量 $\begin{bmatrix} -1 \\ 1 \end{bmatrix}$ 所张成的空间上.
当 $\lambda = 3$ 时,矩阵 $\begin{bmatrix} 3 & 1 \\ 0 & 2 \end{bmatrix}$ 会将对应的特征向量拉伸为原来的 3 倍.

特性与应用
#

没有特征向量的变换
#

二维空间中逆时针旋转 90°的变换就没有实数域上的特征向量.

多个特征向量的变换
#

缩放矩阵

对角矩阵
#

如果一个变换的基向量恰好都是特征向量,那么描述该变换的矩阵是一个对角矩阵, 矩阵的对角元就是这些基向量对应的特征值.

简化高次幂计算
#

对角矩阵的幂次计算非常简单,只需计算其对角元 (特征值) 的相应幂次即可.当我们需要多次计算一个非对角矩阵 $M$ 时,如果它有足够的特征向量,我们可以:

将特征向量作为新的基向量,构成基变换矩阵 $A$.
通过 $A^{-1}MA$ 将 $M$ 转换为对角矩阵 $D$.
计算 $D^n$.
通过 $A D^n A^{-1}$ 将结果转换回原坐标系,即 $M^n = A D^n A^{-1}$.

11-抽象向量空间
#

向量和函数有共同点.

函数作为向量
#

线性性质
#

许多对函数的操作 (如求导) 都是线性的,即满足:

可加性:$L(f + g) = L(f) + L(g)$
成比例:$L(cf) = cL(f)$
多项式的向量表示:我们可以将多项式看作一个维度无限的向量.
- 以一组基函数 $b_0(x)=1, b_1(x)=x, b_2(x)=x^2, \dots$ 为例.
- $1x^2 + 3x + 5 \cdot 1$ 可以视为向量 $\begin{bmatrix} 5, 3, 1, 0, \dots \end{bmatrix}^T$.
- $4x^7 - 5x^2$ 可以视为向量 $\begin{bmatrix} 0, 0, -5, 0, 0, 0, 0, 4, \dots \end{bmatrix}^T$.
求导的矩阵表示:求导这个变换也可以用矩阵来描述.
- $\frac{d}{dx}(a_n x^n + \dots + a_1 x + a_0) = n a_n x^{n-1} + \dots + a_1$
- 这个变换作用在多项式对应的向量上,就像一个矩阵作用于一个向量.

八条公理
#

之所以会这样,是因为向量计算和函数计算都符合这八条公理:

向量加法结合律:$\vec{U} + (\vec{V} + \vec{W}) = (\vec{U} + \vec{V}) + \vec{W}$
向量加法交换律:$\vec{V} + \vec{W} = \vec{W} + \vec{V}$
加法单位元存在:存在一个零向量 $0$, 使得 $0 + \vec{V} = \vec{V}$
加法逆元存在:对任意向量 $\vec{V}$, 存在 $-\vec{V}$, 使得 $\vec{V} + (-\vec{V}) = 0$
标量乘法与域乘法相容:$a(b\vec{V}) = (ab)\vec{V}$
标量乘法单位元存在:$1\vec{V} = \vec{V}$
标量乘法对向量加法分配律:$a(\vec{V} + \vec{W}) = a\vec{V} + a\vec{W}$
标量乘法对域加法分配律:$(a + b)\vec{V} = a\vec{V} + b\vec{V}$

09-基变换#

示例#

坐标系变换#

坐标系逆变换#

案例#

10-特征向量与特征值#

特征向量 (Eigenvector)#

特征值 (Eigenvalue)#

计算方法#

示例#

特性与应用#

没有特征向量的变换#

多个特征向量的变换#

对角矩阵#

简化高次幂计算#

11-抽象向量空间#

函数作为向量#

线性性质#

八条公理#

相关文章

09-基变换
#

示例
#

坐标系变换
#

坐标系逆变换
#

案例
#

10-特征向量与特征值
#

特征向量 (Eigenvector)
#

特征值 (Eigenvalue)
#

计算方法
#

示例
#

特性与应用
#

没有特征向量的变换
#

多个特征向量的变换
#

对角矩阵
#

简化高次幂计算
#

11-抽象向量空间
#

函数作为向量
#

线性性质
#

八条公理
#