跳过正文

线性代数的本质 - 04

538 字·3 分钟

09-基变换
#

我们之前讨论的各种情况,都是在标准基向量 \(\hat{i} = \begin{bmatrix} 1 \\ 0 \end{bmatrix}\) 和 \(\hat{j} = \begin{bmatrix} 0 \\ 1 \end{bmatrix}\) 定义的坐标系中进行的.

在不同的坐标系中,描述同一个向量的坐标是不同的,这是因为我们选用的基向量发生了改变.

示例
#

假设有另一组基向量 \(\hat{i} = \begin{bmatrix} 2 \\ 1 \end{bmatrix}\) 和 \(\hat{j} = \begin{bmatrix} -1 \\ 1 \end{bmatrix}\).

在该坐标系中的向量 \(\begin{bmatrix} 5/3 \\ 1/3 \end{bmatrix}\), 在我们的标准坐标系中被表示为 \(\begin{bmatrix} 3 \\ 2 \end{bmatrix}\).

坐标系变换
#

BasicChange

  • 我们可以将新的基向量构成一个矩阵 \(A = \begin{bmatrix} 2 & -1 \\ 1 & 1 \end{bmatrix}\).
  • 用这个矩阵乘一个在其他坐标系下的向量,就能得到它在标准坐标系下的表示.

$$\begin{bmatrix} 2 & -1 \\ 1 & 1 \end{bmatrix}\begin{bmatrix} 5/3 \\ 1/3 \end{bmatrix} = \begin{bmatrix} 3 \\ 2 \end{bmatrix}$$

坐标系逆变换
#

  • 只需取上述矩阵 \(A\) 的逆矩阵 \(A^{-1}\).
  • 用 \(A^{-1}\) 乘一个标准坐标系下的向量,就能得到它在其他坐标系下的表示.

案例
#

如何在两个不同的坐标系中实现相同的变换?(例如逆时针旋转 90°)

InvertBasic

  • 假设 \(M\) 是标准坐标系下的变换矩阵 (旋转 90°: \(M = \begin{bmatrix} 0 & -1 \\ 1 & 0 \end{bmatrix}\)).
  • 假设 \(A\) 是从其他坐标系到标准坐标系的变换矩阵.
  • 在其他坐标系中实现同样变换的矩阵为 \(A^{-1}MA\).

这个操作的直观理解是:

  1. \(A\): 将向量从其他坐标系变换到标准坐标系.
  2. \(M\): 在标准坐标系中进行旋转.
  3. \(A^{-1}\): 将结果变换回原来的坐标系.

对于基向量为 \(\begin{bmatrix} 2 \\ 1 \end{bmatrix}\) 和 \(\begin{bmatrix} -1 \\ 1 \end{bmatrix}\) 的坐标系,其旋转 90°的变换矩阵为: \(A^{-1}MA = \begin{bmatrix} 2 & -1 \\ 1 & 1 \end{bmatrix} \begin{bmatrix} 0 & -1 \\ 1 & 0 \end{bmatrix} \begin{bmatrix} 1/3 & 1/3 \\ -1/3 & 2/3 \end{bmatrix} = \begin{bmatrix} 1/3 & -5/3 \\ 2/3 & -1/3 \end{bmatrix}\)

10-特征向量与特征值
#

特征向量 (Eigenvector)
#

在经历矩阵所描述的线性变换时,方向保持不变 (仅在其张成的空间内伸缩) 的非零向量.

特征值 (Eigenvalue)
#

特征向量在变换过程中被###拉伸或压缩的比例因子.

从几何上看,如果一个三维空间的旋转可以被看作是围绕一个轴进行的,那么这个轴的方向向量就是一个特征向量,其对应的特征值为 1 (因为它在旋转中没有被拉伸). 这种理解方式远比一个 3x3 矩阵要直观.

计算方法
#

公式:\(A\vec{V} = \lambda\vec{V}\)

  • \(A\): 变换矩阵
  • \(\vec{V}\): 特征向量
  • \(\lambda\): 特征值

为了求解,我们将公式变形: \(A\vec{V} - \lambda\vec{V} = 0\) \(A\vec{V} - \lambda I\vec{V} = 0\) \((A - \lambda I)\vec{V} = 0\)

  • 这个结果说明,特征向量 \(\vec{V}\) 经过 \((A - \lambda I)\) 变换后,会被压缩成零向量.
  • 这意味着变换 \((A - \lambda I)\) 是一个降维的变换,所以它的行列式必定为零.
  • \(\det(A - \lambda I) = 0\)

示例
#

EigenvectorDemo

对于矩阵 \(A = \begin{bmatrix} 3 & 1 \\ 0 & 2 \end{bmatrix}\): \(\det(A - \lambda I) = \det \left( \begin{bmatrix} 3 & 1 \\ 0 & 2 \end{bmatrix} - \lambda \begin{bmatrix} 1 & 0 \\ 0 & 1 \end{bmatrix} \right) = \det \begin{bmatrix} 3-\lambda & 1 \\ 0 & 2-\lambda \end{bmatrix} = (3-\lambda)(2-\lambda) = 0\) 解得特征值 \(\lambda = 2\) 或 \(\lambda = 3\).

  • 当 \(\lambda = 2\) 时,我们求解 \((A - 2I)\vec{V}\) = \(\begin{bmatrix} 1 & 1 \\ 0 & 0 \end{bmatrix} \begin{bmatrix} x \\ y \end{bmatrix} = \begin{bmatrix} 0 \\ 0 \end{bmatrix}\) 所有解都在向量 \(\begin{bmatrix} -1 \\ 1 \end{bmatrix}\) 所张成的空间上.

  • 当 \(\lambda = 3\) 时,矩阵 \(\begin{bmatrix} 3 & 1 \\ 0 & 2 \end{bmatrix}\) 会将对应的特征向量拉伸为原来的 3 倍.

特性与应用
#

没有特征向量的变换
#

二维空间中逆时针旋转 90°的变换就没有实数域上的特征向量.

多个特征向量的变换
#

缩放矩阵

对角矩阵
#

如果一个变换的基向量恰好都是特征向量,那么描述该变换的矩阵是一个对角矩阵, 矩阵的对角元就是这些基向量对应的特征值.

简化高次幂计算
#

对角矩阵的幂次计算非常简单,只需计算其对角元 (特征值) 的相应幂次即可.当我们需要多次计算一个非对角矩阵 \(M\) 时,如果它有足够的特征向量,我们可以:

  1. 将特征向量作为新的基向量,构成基变换矩阵 \(A\).
  2. 通过 \(A^{-1}MA\) 将 \(M\) 转换为对角矩阵 \(D\).
  3. 计算 \(D^n\).
  4. 通过 \(A D^n A^{-1}\) 将结果转换回原坐标系,即 \(M^n = A D^n A^{-1}\).

11-抽象向量空间
#

向量和函数有共同点.

函数作为向量
#

线性性质
#

许多对函数的操作 (如求导) 都是线性的,即满足:

  • 可加性:\(L(f + g) = L(f) + L(g)\)

  • 成比例:\(L(cf) = cL(f)\)

  • 多项式的向量表示:我们可以将多项式看作一个维度无限的向量.

    • 以一组基函数 \(b_0(x)=1, b_1(x)=x, b_2(x)=x^2, \dots\) 为例.
    • \(1x^2 + 3x + 5 \cdot 1\) 可以视为向量 \(\begin{bmatrix} 5, 3, 1, 0, \dots \end{bmatrix}^T\).
    • \(4x^7 - 5x^2\) 可以视为向量 \(\begin{bmatrix} 0, 0, -5, 0, 0, 0, 0, 4, \dots \end{bmatrix}^T\).
  • 求导的矩阵表示:求导这个变换也可以用矩阵来描述.

    • \(\frac{d}{dx}(a_n x^n + \dots + a_1 x + a_0) = n a_n x^{n-1} + \dots + a_1\)
    • 这个变换作用在多项式对应的向量上,就像一个矩阵作用于一个向量.

八条公理
#

之所以会这样,是因为向量计算和函数计算都符合这八条公理:

  1. 向量加法结合律:\(\vec{U} + (\vec{V} + \vec{W}) = (\vec{U} + \vec{V}) + \vec{W}\)
  2. 向量加法交换律:\(\vec{V} + \vec{W} = \vec{W} + \vec{V}\)
  3. 加法单位元存在:存在一个零向量 \(0\), 使得 \(0 + \vec{V} = \vec{V}\)
  4. 加法逆元存在:对任意向量 \(\vec{V}\), 存在 \(-\vec{V}\), 使得 \(\vec{V} + (-\vec{V}) = 0\)
  5. 标量乘法与域乘法相容:\(a(b\vec{V}) = (ab)\vec{V}\)
  6. 标量乘法单位元存在:\(1\vec{V} = \vec{V}\)
  7. 标量乘法对向量加法分配律:\(a(\vec{V} + \vec{W}) = a\vec{V} + a\vec{W}\)
  8. 标量乘法对域加法分配律:\((a + b)\vec{V} = a\vec{V} + b\vec{V}\)

相关文章

线性代数的本质 - 02
781 字·4 分钟
线性代数的本质 - 03
284 字·2 分钟