09-基变换#
我们之前讨论的各种情况,都是在标准基向量 \(\hat{i} = \begin{bmatrix} 1 \\ 0 \end{bmatrix}\) 和 \(\hat{j} = \begin{bmatrix} 0 \\ 1 \end{bmatrix}\) 定义的坐标系中进行的.
在不同的坐标系中,描述同一个向量的坐标是不同的,这是因为我们选用的基向量发生了改变.
示例#
假设有另一组基向量 \(\hat{i} = \begin{bmatrix} 2 \\ 1 \end{bmatrix}\) 和 \(\hat{j} = \begin{bmatrix} -1 \\ 1 \end{bmatrix}\).
在该坐标系中的向量 \(\begin{bmatrix} 5/3 \\ 1/3 \end{bmatrix}\), 在我们的标准坐标系中被表示为 \(\begin{bmatrix} 3 \\ 2 \end{bmatrix}\).
坐标系变换#
- 我们可以将新的基向量构成一个矩阵 \(A = \begin{bmatrix} 2 & -1 \\ 1 & 1 \end{bmatrix}\).
- 用这个矩阵乘一个在其他坐标系下的向量,就能得到它在标准坐标系下的表示.
$$\begin{bmatrix} 2 & -1 \\ 1 & 1 \end{bmatrix}\begin{bmatrix} 5/3 \\ 1/3 \end{bmatrix} = \begin{bmatrix} 3 \\ 2 \end{bmatrix}$$
坐标系逆变换#
- 只需取上述矩阵 \(A\) 的逆矩阵 \(A^{-1}\).
- 用 \(A^{-1}\) 乘一个标准坐标系下的向量,就能得到它在其他坐标系下的表示.
案例#
如何在两个不同的坐标系中实现相同的变换?(例如逆时针旋转 90°)
- 假设 \(M\) 是标准坐标系下的变换矩阵 (旋转 90°: \(M = \begin{bmatrix} 0 & -1 \\ 1 & 0 \end{bmatrix}\)).
- 假设 \(A\) 是从其他坐标系到标准坐标系的变换矩阵.
- 在其他坐标系中实现同样变换的矩阵为 \(A^{-1}MA\).
这个操作的直观理解是:
- \(A\): 将向量从其他坐标系变换到标准坐标系.
- \(M\): 在标准坐标系中进行旋转.
- \(A^{-1}\): 将结果变换回原来的坐标系.
对于基向量为 \(\begin{bmatrix} 2 \\ 1 \end{bmatrix}\) 和 \(\begin{bmatrix} -1 \\ 1 \end{bmatrix}\) 的坐标系,其旋转 90°的变换矩阵为: \(A^{-1}MA = \begin{bmatrix} 2 & -1 \\ 1 & 1 \end{bmatrix} \begin{bmatrix} 0 & -1 \\ 1 & 0 \end{bmatrix} \begin{bmatrix} 1/3 & 1/3 \\ -1/3 & 2/3 \end{bmatrix} = \begin{bmatrix} 1/3 & -5/3 \\ 2/3 & -1/3 \end{bmatrix}\)
10-特征向量与特征值#
特征向量 (Eigenvector)#
在经历矩阵所描述的线性变换时,方向保持不变 (仅在其张成的空间内伸缩) 的非零向量.
特征值 (Eigenvalue)#
特征向量在变换过程中被###拉伸或压缩的比例因子.
从几何上看,如果一个三维空间的旋转可以被看作是围绕一个轴进行的,那么这个轴的方向向量就是一个特征向量,其对应的特征值为 1 (因为它在旋转中没有被拉伸). 这种理解方式远比一个 3x3 矩阵要直观.
计算方法#
公式:\(A\vec{V} = \lambda\vec{V}\)
- \(A\): 变换矩阵
- \(\vec{V}\): 特征向量
- \(\lambda\): 特征值
为了求解,我们将公式变形: \(A\vec{V} - \lambda\vec{V} = 0\) \(A\vec{V} - \lambda I\vec{V} = 0\) \((A - \lambda I)\vec{V} = 0\)
- 这个结果说明,特征向量 \(\vec{V}\) 经过 \((A - \lambda I)\) 变换后,会被压缩成零向量.
- 这意味着变换 \((A - \lambda I)\) 是一个降维的变换,所以它的行列式必定为零.
- \(\det(A - \lambda I) = 0\)
示例#
对于矩阵 \(A = \begin{bmatrix} 3 & 1 \\ 0 & 2 \end{bmatrix}\): \(\det(A - \lambda I) = \det \left( \begin{bmatrix} 3 & 1 \\ 0 & 2 \end{bmatrix} - \lambda \begin{bmatrix} 1 & 0 \\ 0 & 1 \end{bmatrix} \right) = \det \begin{bmatrix} 3-\lambda & 1 \\ 0 & 2-\lambda \end{bmatrix} = (3-\lambda)(2-\lambda) = 0\) 解得特征值 \(\lambda = 2\) 或 \(\lambda = 3\).
当 \(\lambda = 2\) 时,我们求解 \((A - 2I)\vec{V}\) = \(\begin{bmatrix} 1 & 1 \\ 0 & 0 \end{bmatrix} \begin{bmatrix} x \\ y \end{bmatrix} = \begin{bmatrix} 0 \\ 0 \end{bmatrix}\) 所有解都在向量 \(\begin{bmatrix} -1 \\ 1 \end{bmatrix}\) 所张成的空间上.
当 \(\lambda = 3\) 时,矩阵 \(\begin{bmatrix} 3 & 1 \\ 0 & 2 \end{bmatrix}\) 会将对应的特征向量拉伸为原来的 3 倍.
特性与应用#
没有特征向量的变换#
二维空间中逆时针旋转 90°的变换就没有实数域上的特征向量.
多个特征向量的变换#
缩放矩阵
对角矩阵#
如果一个变换的基向量恰好都是特征向量,那么描述该变换的矩阵是一个对角矩阵, 矩阵的对角元就是这些基向量对应的特征值.
简化高次幂计算#
对角矩阵的幂次计算非常简单,只需计算其对角元 (特征值) 的相应幂次即可.当我们需要多次计算一个非对角矩阵 \(M\) 时,如果它有足够的特征向量,我们可以:
- 将特征向量作为新的基向量,构成基变换矩阵 \(A\).
- 通过 \(A^{-1}MA\) 将 \(M\) 转换为对角矩阵 \(D\).
- 计算 \(D^n\).
- 通过 \(A D^n A^{-1}\) 将结果转换回原坐标系,即 \(M^n = A D^n A^{-1}\).
11-抽象向量空间#
向量和函数有共同点.
函数作为向量#
线性性质#
许多对函数的操作 (如求导) 都是线性的,即满足:
可加性:\(L(f + g) = L(f) + L(g)\)
成比例:\(L(cf) = cL(f)\)
多项式的向量表示:我们可以将多项式看作一个维度无限的向量.
- 以一组基函数 \(b_0(x)=1, b_1(x)=x, b_2(x)=x^2, \dots\) 为例.
- \(1x^2 + 3x + 5 \cdot 1\) 可以视为向量 \(\begin{bmatrix} 5, 3, 1, 0, \dots \end{bmatrix}^T\).
- \(4x^7 - 5x^2\) 可以视为向量 \(\begin{bmatrix} 0, 0, -5, 0, 0, 0, 0, 4, \dots \end{bmatrix}^T\).
求导的矩阵表示:求导这个变换也可以用矩阵来描述.
- \(\frac{d}{dx}(a_n x^n + \dots + a_1 x + a_0) = n a_n x^{n-1} + \dots + a_1\)
- 这个变换作用在多项式对应的向量上,就像一个矩阵作用于一个向量.
八条公理#
之所以会这样,是因为向量计算和函数计算都符合这八条公理:
- 向量加法结合律:\(\vec{U} + (\vec{V} + \vec{W}) = (\vec{U} + \vec{V}) + \vec{W}\)
- 向量加法交换律:\(\vec{V} + \vec{W} = \vec{W} + \vec{V}\)
- 加法单位元存在:存在一个零向量 \(0\), 使得 \(0 + \vec{V} = \vec{V}\)
- 加法逆元存在:对任意向量 \(\vec{V}\), 存在 \(-\vec{V}\), 使得 \(\vec{V} + (-\vec{V}) = 0\)
- 标量乘法与域乘法相容:\(a(b\vec{V}) = (ab)\vec{V}\)
- 标量乘法单位元存在:\(1\vec{V} = \vec{V}\)
- 标量乘法对向量加法分配律:\(a(\vec{V} + \vec{W}) = a\vec{V} + a\vec{W}\)
- 标量乘法对域加法分配律:\((a + b)\vec{V} = a\vec{V} + b\vec{V}\)