09-基变换#
我们之前讨论的各种情况,都是在标准基向量 $\hat{i} = \begin{bmatrix} 1 \ 0 \end{bmatrix}$ 和 $\hat{j} = \begin{bmatrix} 0 \ 1 \end{bmatrix}$ 定义的坐标系中进行的.
在不同的坐标系中,描述同一个向量的坐标是不同的,这是因为我们选用的基向量发生了改变.
示例#
假设有另一组基向量 $\hat{i}’ = \begin{bmatrix} 2 \ 1 \end{bmatrix}$ 和 $\hat{j}’ = \begin{bmatrix} -1 \ 1 \end{bmatrix}$.
在该坐标系中的向量 $\begin{bmatrix} 5/3 \ 1/3 \end{bmatrix}$, 在我们的标准坐标系中被表示为 $\begin{bmatrix} 3 \ 2 \end{bmatrix}$.
坐标系变换#
- 我们可以将新的基向量构成一个矩阵 $A = \begin{bmatrix} 2 & -1 \ 1 & 1 \end{bmatrix}$.
- 用这个矩阵乘一个在其他坐标系下的向量,就能得到它在标准坐标系下的表示.
$$\begin{bmatrix} 2 & -1 \ 1 & 1 \end{bmatrix}\begin{bmatrix} 5/3 \ 1/3 \end{bmatrix} = \begin{bmatrix} 3 \ 2 \end{bmatrix}$$
坐标系逆变换#
- 只需取上述矩阵 $A$ 的逆矩阵 $A^{-1}$.
- 用 $A^{-1}$ 乘一个标准坐标系下的向量,就能得到它在其他坐标系下的表示.
案例#
如何在两个不同的坐标系中实现相同的变换?(例如逆时针旋转 90°)
- 假设 $M$ 是标准坐标系下的变换矩阵 (旋转 90°: $M = \begin{bmatrix} 0 & -1 \ 1 & 0 \end{bmatrix}$).
- 假设 $A$ 是从其他坐标系到标准坐标系的变换矩阵.
- 在其他坐标系中实现同样变换的矩阵为 $A^{-1}MA$.
这个操作的直观理解是:
- $A$: 将向量从其他坐标系变换到标准坐标系.
- $M$: 在标准坐标系中进行旋转.
- $A^{-1}$: 将结果变换回原来的坐标系.
对于基向量为 $\begin{bmatrix} 2 \ 1 \end{bmatrix}$ 和 $\begin{bmatrix} -1 \ 1 \end{bmatrix}$ 的坐标系,其旋转 90°的变换矩阵为: $A^{-1}MA = \begin{bmatrix} 2 & -1 \ 1 & 1 \end{bmatrix} \begin{bmatrix} 0 & -1 \ 1 & 0 \end{bmatrix} \begin{bmatrix} 1/3 & 1/3 \ -1/3 & 2/3 \end{bmatrix} = \begin{bmatrix} 1/3 & -5/3 \ 2/3 & -1/3 \end{bmatrix}$
10-特征向量与特征值#
特征向量 (Eigenvector)#
在经历矩阵所描述的线性变换时,方向保持不变 (仅在其张成的空间内伸缩) 的非零向量.
特征值 (Eigenvalue)#
特征向量在变换过程中被###拉伸或压缩的比例因子.
从几何上看,如果一个三维空间的旋转可以被看作是围绕一个轴进行的,那么这个轴的方向向量就是一个特征向量,其对应的特征值为 1 (因为它在旋转中没有被拉伸). 这种理解方式远比一个 3x3 矩阵要直观.
计算方法#
公式:$A\vec{v} = \lambda\vec{v}$
- $A$: 变换矩阵
- $\vec{v}$: 特征向量
- $\lambda$: 特征值
为了求解,我们将公式变形: $A\vec{v} - \lambda\vec{v} = 0$ $A\vec{v} - \lambda I\vec{v} = 0$ $(A - \lambda I)\vec{v} = 0$
- 这个结果说明,特征向量 $\vec{v}$ 经过 $(A - \lambda I)$ 变换后,会被压缩成零向量.
- 这意味着变换 $(A - \lambda I)$ 是一个降维的变换,所以它的行列式必定为零.
- $\det(A - \lambda I) = 0$
示例#
对于矩阵 $A = \begin{bmatrix} 3 & 1 \ 0 & 2 \end{bmatrix}$: $\det(A - \lambda I) = \det \left( \begin{bmatrix} 3 & 1 \ 0 & 2 \end{bmatrix} - \lambda \begin{bmatrix} 1 & 0 \ 0 & 1 \end{bmatrix} \right) = \det \begin{bmatrix} 3-\lambda & 1 \ 0 & 2-\lambda \end{bmatrix} = (3-\lambda)(2-\lambda) = 0$ 解得特征值 $\lambda = 2$ 或 $\lambda = 3$.
当 $\lambda = 2$ 时,我们求解 $(A - 2I)\vec{v}$ = $\begin{bmatrix} 1 & 1 \ 0 & 0 \end{bmatrix} \begin{bmatrix} x \ y \end{bmatrix} = \begin{bmatrix} 0 \ 0 \end{bmatrix}$ 所有解都在向量 $\begin{bmatrix} -1 \ 1 \end{bmatrix}$ 所张成的空间上.
当 $\lambda = 3$ 时,矩阵 $\begin{bmatrix} 3 & 1 \ 0 & 2 \end{bmatrix}$ 会将对应的特征向量拉伸为原来的 3 倍.
特性与应用#
没有特征向量的变换#
二维空间中逆时针旋转 90°的变换就没有实数域上的特征向量.
多个特征向量的变换#
缩放矩阵
对角矩阵#
如果一个变换的基向量恰好都是特征向量,那么描述该变换的矩阵是一个###对角矩阵###, 矩阵的对角元就是这些基向量对应的特征值.
简化高次幂计算#
对角矩阵的幂次计算非常简单,只需计算其对角元 (特征值) 的相应幂次即可.当我们需要多次计算一个非对角矩阵 $M$ 时,如果它有足够的特征向量,我们可以:
- 将特征向量作为新的基向量,构成基变换矩阵 $A$.
- 通过 $A^{-1}MA$ 将 $M$ 转换为对角矩阵 $D$.
- 计算 $D^n$.
- 通过 $A D^n A^{-1}$ 将结果转换回原坐标系,即 $M^n = A D^n A^{-1}$.
11-抽象向量空间#
向量和函数有共同点.
函数作为向量#
线性性质#
许多对函数的操作 (如求导) 都是线性的,即满足:
可加性:$L(f + g) = L(f) + L(g)$
成比例:$L(cf) = cL(f)$
多项式的向量表示:我们可以将多项式看作一个维度无限的向量.
- 以一组基函数 $b_0(x)=1, b_1(x)=x, b_2(x)=x^2, \dots$ 为例.
- $1x^2 + 3x + 5 \cdot 1$ 可以视为向量 $\begin{bmatrix} 5, 3, 1, 0, \dots \end{bmatrix}^T$.
- $4x^7 - 5x^2$ 可以视为向量 $\begin{bmatrix} 0, 0, -5, 0, 0, 0, 0, 4, \dots \end{bmatrix}^T$.
求导的矩阵表示:求导这个变换也可以用矩阵来描述.
- $\frac{d}{dx}(a_n x^n + \dots + a_1 x + a_0) = n a_n x^{n-1} + \dots + a_1$
- 这个变换作用在多项式对应的向量上,就像一个矩阵作用于一个向量.
八条公理#
之所以会这样,是因为向量计算和函数计算都符合这八条公理:
- 向量加法结合律:$U + (V + W) = (U + V) + W$
- 向量加法交换律:$V + W = W + V$
- 加法单位元存在:存在一个零向量 $0$, 使得 $0 + V = V$
- 加法逆元存在:对任意向量 $V$, 存在 $-V$, 使得 $V + (-V) = 0$
- 标量乘法与域乘法相容:$a(bV) = (ab)V$
- 标量乘法单位元存在:$1V = V$
- 标量乘法对向量加法分配律:$a(V + W) = aV + aW$
- 标量乘法对域加法分配律:$(a + b)V = aV + bV$