不变子空间
对于线性变换 $T \in L(V), U$ 是 $V$ 的子空间.
若 $\forall \alpha \in U, T(\alpha) \in U$, 则 $U$ 是 $T$ 的不变子空间.
为什么要引入不变子空间的概念呢, 我们可以考察一个具体的例子.
对于一个线性空间 $V, \dim V = 6$.
设 $V = U_1 \oplus U_2 \oplus U_3$, 并且 $U_1, U_2, U_3$ 中的基分别为 ${\alpha_1, \alpha_2}, {\alpha_3, \alpha_4}, {\alpha_5, \alpha_6}$.
如果 $U_1, U_2, U_3$ 是不变子空间.
则
即 $T$ 对应的矩阵为分块对角阵.
进一步, 如果 $V$ 可以写为很多一维不变子空间的直和, 那么 $T$ 对应的矩阵将是对角阵. 进而可以写出特征值和特征向量.
$T \in L(V), T(\alpha) = \lambda \alpha$. 那么 $\lambda$ 和 $\alpha$ 是对应的特征值与特征向量.
特征向量线性无关
不同特征值对应的特征向量线性无关.
$T \in L(V)$, 且 $\lambda_1, \lambda_2, \cdots, \lambda_k$ 为 $T$ 的不同特征值.
$\alpha_1, \alpha_2, \cdots, \alpha_k$ 为对应的特征向量. 则 $\alpha_1, \alpha_2, \cdots, \alpha_k$ 线性无关.
设 $\alpha1, \alpha_2, \cdots, \alpha_k$ 线性相关, 那么取最小的 $j$ 使得 $\alpha_j \in \text{span} {\alpha_1, \alpha_2, \cdots, \alpha{j-1}}$. \
可以写成 $\alphaj = x_1\alpha_1 + x_2\alpha_2 + \cdots + x{j-1}\alpha{j-1}$. \
对等式两边施加线性变换可得:
$\lambda_j\alpha_j = \lambda_1x_1\alpha_1 + \lambda_2x_2\alpha_2 + \cdots + \lambda{j-1}x{j-1}\alpha{j-1}$.
$(a) - (b)$ 得,
由于 $\lambdai - \lambda_j \neq 0$, $x_i = 0$.
从而 $\alpha_j = x_1\alpha_1 + x_2\alpha_2 + \cdots + x{j-1}\alpha_{j-1} = 0$.
而 $\alpha_j$ 是特征向量, 不等于 $0$. 因此矛盾.
性质
对于 $T \in L(V)$ 的特征值 $\lambda$, 有这样的几个等价结论.
- $\lambda$ 是 $T$ 的特征值
- $T - \lambda I$ 非单射
- $T - \lambda I$ 非满射
- $T - \lambda I$ 非可逆
说明 $1.) \Rightarrow 2.)$, \
$T(\alpha) = \lambda \alpha \Rightarrow (T - \lambda I) \alpha = 0$, 也就是说 $T - \lambda I$ 的零空间中存在非零元素 $\alpha$. 那么 $T - \lambda I$ 必然不是单射.
说明 $2.) \Rightarrow 3.)$ 可以通过维数公式说明:
$\dim \text{null }(T - \lambda I) + \dim \text{range }(T - \lambda I) = \dim V$.
如果 $T - \lambda I$ 非单射, 也就是 $\dim \text{null }(T - \lambda I) > 0$.
那么 $\dim \text{range }(T - \lambda I) < \dim V$, 即 $T - \lambda I$ 非满射.
根据 $T - \lambda I$ 非单射/满射容易得到 $T - \lambda I$ 非可逆.
特征值存在
在复数域上, 特征值一定存在.
对于 $T = L(V), \dim = n, F = C$, 证明特征值的存在性.
考虑 $n+1$ 个向量 ${\alpha, T(\alpha), T^2(\alpha), \cdots, T^n(\alpha)}$. 由于 $\dim V = n$, 则这 $n+1$ 个向量线性相关. 因此存在不全为 $0$ 的 $x_i$, 使得
那么一定存在 $(T - \lambda_i I) (\alpha) = 0$ 的情况, 因此特征值存在.
线性变换对应的上三角矩阵
对于 $T \in L(V)$, 如何在 $V$ 中取一组基使得 $T$ 对应的变换矩阵形式简单呢.
我们可以证明, 一定可以取一组基使得 $T(\alpha_1, \alpha_2, \cdots, \alpha_n) = (\alpha_1, \alpha_2, \cdots, \alpha_n) A$, $A$ 是上三角.
除了说 $A$ 是上三角矩阵之外我们还有如下等价的定义
- $A$ 为上三角矩阵
- $T(\alpha_i) = \text{Span} (\alpha_1, \alpha_2, \cdots, \alpha_i)$
- $\text{Span} (\alpha_1, \alpha_2, \cdots, \alpha_i)$ 是 $T$ 的不变子空间
商变换
$T \in L(V)$, 若 $U$ 为 $V$ 的不变子空间, 可以定义 $T|_U$. 也就是将 $T$ 的作用范围从 $V$ 缩小到 $U$.
商变换 $T/_U \in L(V/U), T/_U(\alpha + U) = T(\alpha) + U$.
证明上三角
要证: $T$ 中一定存在一组基, $T$ 在该基下的矩阵为上三角阵.
数学归纳法
利用数学归纳法证明,
- 当 $n=1$, 显然对于一维空间的线性变换矩阵是上三角
- 已知对 $n-1$ 维的空间, 存在一组基使得 $T$ 对应的变换矩阵为上三角. \
已知 $\dim V = n$, 考虑商空间 $\dim U/V, U = \text{Span} (\alpha_1)$. \
由于 $\dim U/V = n-1$, 因此对于 $2 \le i \le n$,又 $T/_U(\alpha_i + U) = T(\alpha_i) + U$, 可得根据商空间的性质我们知道因此 $T$ 对应的矩阵可以写成上三角.
矩阵法
因为 $T$ 在不同基下对应的变换矩阵都是相似的. 所以如果能够证明, 任意矩阵都与某个上三角阵相似. 那么结论成立.
即 $\forall A \in C^{n \times n}, A$ 一定相似于一个上三角阵.(Schur 三角化定理)
我记得自己写过 Schur 三角化定理 的证明, 先不记录老师的想法. 之后结合司梅的证明思路写一下.
特征子空间
可以用特征值特征向量定义子空间 $E(T, \lambda) = {\alpha: T(\alpha) = \lambda \alpha}$. \
我们之前已经说明过, 不同特征值对应的特征向量是线性无关的. 因此 $E(T, \lambda_1), \cdots, E(T, \lambda_m)$ 的共同元素只有 $0$.
那么如果 $T$ 有 $n$ 个线性无关的特征向量, $E(T, \lambda_1) + E(T, \lambda_2) + \cdots + E(T, \lambda_m) = V$.
但是通常没有这么好的结论, 只能得到 $E(T, \lambda_1) + E(T, \lambda_2) + \cdots + E(T, \lambda_m) \le V$.