导子与 Lie 括积
[来自 给大一学生的 Lie 代数]
在微积分中, "微分", 或 "求导" 是典型的线性运算:
`(k f + l g)' = k f' + l g'`,
它最具特色的性质就是乘积的求导公式
`(f g)' = f'g + f g'`.
我们将 "求导" 运算推广到线性空间中来, 首先要求线性空间中有定义 "乘积".
事实上, 许多常见的线性空间都有定义乘积. 如 `bbb F[x]` 中的多项式乘法,
`C^oo(a,b)` 中函数的逐点乘法, `bbb F^(n xx n)` 中的矩阵乘法, 乃至
`"End"V` (`V` 上全体线性变换) 中线性变换间的乘法. 由此给出导子的定义:
设 `V` 是定义了乘法的线性空间, 若 `V` 上线性变换 `D` 满足
`D(f g) = D(f) g + f D(g)`, `quad AA f, g in V`,
则称 `D` 是 `V` 的导子. `V` 中全体导子
`"Der"V` 按线性变换的加法和数乘构成 `"End"V` 的线性子空间.
若 `A, B in "DerV`, 则 `A B - B A in "Der"V`.
`AA f, g in V`,
`(A B - B A) (f g)`
`= A B(f g) - B A(f g)`
`= A(B(f)g + f B(g)) - B(A(f)g + f A(g))`
`= A B(f)g + B(f)A(g) + A(f)B(g) + f A B(g)`
`quad - B A(f)g - A(f)B(g) - B(f)A(g) - f B A(g)`
`= (A B-B A)(f)g + f(A B-B A)(g)`.
设 `V` 是定义了代数的线性空间, `A, B in V`. 称
`[A, B] := A B - B A`
为 Lie 括积, 简称括积.
Lie 括积满足:
- 双线性性: `[k A + l B, C] = k [A, C] + l[B, C]`, `[A, k B + l C] = k[A, B] + l[A, C]`;
- 反对称性 `[A, B] = -[B, A]`;
- 二重公式 `[A, B C] = [A, B]C + B[A, C]`;
- Jacobi 恒等式 `sum_"cyc"[[A, B], C] = 0`.
4 的证明:
`sum_"cyc" (A B-B A)C - C(A B-B A)`
`= sum_"cyc" (A B C - C A B) + sum_"cyc" (C B A - B A C)`
`= 0 + 0`.
在 `bbb F^(n xx n)` 中:
- 若 `A, B` 是反对称矩阵, 则 `[A, B]` 是反对称矩阵;
- 若 `A, B` 是对称矩阵, 则 `[A, B]` 是反对称矩阵;
- 若 `A, B` 一个对称, 一个反对称, 则 `[A, B]` 对称.
总之, 用 1 表示反对称, -1 表示对称, 欲知括积的对称性, 只需将两数相乘.
性质 1. 是重要的, 它指出 Lie 括积的运算在反对称矩阵中封闭.
下面的定理将括积和导子再次联系到一起.
设 `V` 是定义了乘法的有限维线性空间,
在 `V` 上定义 `"ad"_A(B) = [A, B]`, 则 `"ad"_A in "Der"V`;
反之, 对任意 `D in "Der"V`, 存在 `A in V` 使得 `D = "ad"_A`.
- 由括积的性质 3,
`"ad"_A(B C) = "ad"_A(B) C + B "ad"_A(C)`,
即 `"ad"_A` 是导子.
- 参见 "derivation of `fr(gl)(V)` must be inner".
矩阵运算补遗
记 `e_(i j)` 是 `i` 行 `j` 列为 1, 其它位置为 0 的 `n xx n` 矩阵.
- 令 `A` 是 `n xx n` 矩阵, 则
`A e_(i j) = "把 "A" 的第 i 列粘贴到零矩阵的第 j 列`,
`e_(i j) A = "把 "A" 的第 j 行粘贴到零矩阵的第 i 行`.
因此
`[A, e_(i j)] = A e_(i j) - e_(i j) A`
`= [
, , a_(1 i);
, , vdots;
-a_(j 1), cdots, a_(i i) - a_(j j), cdots, -a_(j n);
, , vdots;
, , a_(n i)
]`.
- `e_(RED i BLUE j) e_(BLUE k RED l) = delta_(BLUE(j k)) e_(RED(i l))`, 因此
`[e_(RED i BLUE j), e_(BLUE k RED l)] = delta_(BLUE(j k)) e_(RED(i l)) - delta_(RED(l i)) e_(BLUE(k j))`
`= {
0, if j != k and i != l;
e_(RED(i l)), if j = k and i != l;
-e_(BLUE(k j)), if j != k and i = l;
e_(RED(i i)) - e_(BLUE(j j)), if j = k and i = l;
:}`
-
记 `E_(i j) = e_(i j) - e_(j i)`, 它是反对称矩阵, `E_(i j) + E_(j i) = 0`, `E_(i i) = 0`.
利用 `[A, E_(i j)] = [A, e_(i j)] - [A, e_(j i)]`, 我们有
`[A, E_(i j)] = {:
, {: ,,,,,,,,,,, i ,,,,,,, j; :};
{: ;;i;;j;; :},
[
,,,-a_(1 j),,a_(1 i);
,,,-a_(2 j),,a_(2 i);
,,,vdots,,vdots;
-a_(j 1),-a_(j 2),...,-a_(j i)-a_(i j),...,-a_(j j)+a_(i i),...,-a_(j n);
,,,vdots,,vdots;
a_(i 1),a_(i 2),...,a_(i i)-a_(j j),...,a_(i j)+a_(j i),...,a_(i n);
,,,vdots,,vdots;
,,,-a_(n j),,a_(n i)
]
:}`.
-
暴力展开得到
`[E_(i j), E_(k l)]`
`= delta_(j k) E_(i l) + delta_(i l) E_(j k) + delta_(k i) E_(l j) + delta_(l j) E_(k i)`.
特别 `i, j, k` 两两不等时,
`[E_(i j), E_(j k)] = E_(i k)`,
`quad [E_(i j), E_(k i)] = E_(j k)`.
`i, j, k, l` 两两不等时,
`[E_(i j), E_(k l)] = 0`.
-
记 `tilde E_(i j) = e_(i j) + e_(j i)`, 它是对称矩阵, `tilde E_(i j) = tilde E_(j i)`.
Lie 代数
Lie 代数的定义
`bbb F` 上的线性空间 `V` 上的一个二元运算 `[A, B]`, 如果对任意 `A, B, C in V` 成立:
- 双线性性: `[k A + l B, C] = k [A, C] + l[B, C]`, `[A, k B + l C] = k[A, B] + l[A, C]`,
`k, l in bbb F`;
- 自相关性: `[A, A] = 0`;
- Jacobi 恒等式: `sum_"cyc"[[A, B], C] = 0`.
则称 `[A, B]` 是 `V` 上的一个 Lie 括积. `V` 连同其上的 Lie 括积一起构成一个 Lie 代数.
注意到 `0 = [A+B, A+B]` `= [A, A] + [B, B] + [A, B] + [B, A]`, 因此 2. 又推出:
- 反对称性: `[A, B] = -[B, A]`;
反之, 若 `bbb F` 的特征不等于 2, 则反对称性也可以推出自相关性.
设 `L` 是一个 Lie 代数, `K` 是 `L` 的线性子空间, 且对括积运算封闭, 则称 `K` 是 `L` 的子代数,
记为 `K le L`.
- `"End" V` 连同其上的括积运算构成一个 Lie 代数, 记为 `fr(gl)(V)`.
- 设 `V` 上有定义乘法, 则 `"Der" V` 是 `fr(gl)(V) = "End" V` 的子代数.
特别地, Lie 代数 `L` 上的括积运算是一种乘法, 因此 `"Der"L` 有定义.
- `V` 上全体迹零的线性变换构成 `fr(gl)(V)` 的子代数, 记为 `fr(sl)(V)`.
1, 2 已在前一节中验证过. 下证 3,
这只需说明 `fr(sl)(V)` 对括积运算封闭:
设 `A, B` 是迹零的矩阵, 则
`"tr"[A, B]`
`= "tr" A B - "tr" A B`
`= 0`.
`fr(sl)(V)` 的一个基底是
所有 `e_(i j)`, `quad i != j`,
以及所有 `e_(i i) - e_(n n)`, `quad n = "dim"V`,
共 `n^2-1` 个矩阵.
线性空间 `V` 上的反对称双线性函数是指一个双线性函数 `f: V xx V to bbb F`, 满足 `f(v, w) = -f(w, v)`.
对称双线性函数是指 `f(v, w) = f(w, v)`.
- 设 `"dim"V = 2l`, 令 `f` 是 `V` 上的反对称双线性函数, 度量矩阵为 `s = [0, I_l; -I_l, 0]`.
`V` 上一切满足
`f(x(v), w) = -f(v, x(w))`
的线性变换 `x` 构成 `fr(gl)(V)` 的子代数,
记为 `fr(sp)(V)`.
- 将 1. 中 `V` 的维数换成 `2l+1`, `f` 换成对称双线性型,
度量矩阵为 `[1, 0, 0; 0, 0, I_l; 0, I_l, 0]`,
条件 `f(x(v), w) = -f(v, x(w))` 不变,
此时得到奇数维的 Lie 代数 `fr(o)(V)`.
- 将 1. 中维数换成 `2l`, 度量矩阵换为 `[0, I_l; I_l, 0]`.
此时得到偶数维的 Lie 代数 `fr(o)(V)`.
-
设 `x, y in fr(sp)(V)`, 则
`f([x,y](v), w) + f(v, [x,y](w))`
`= f(x y v - y x v, w) + f(v, x y w - y x w)`
`= f(x y v, w) - f(y x v, w) + f(v, x y w) - f(v, y x w)`
`= -f(y v, x w) + f(x v, y w) - f(x v, y w) + f(y v, x w)`
`= 0`.
因此 `fr(sp)(V)` 对括积运算封闭. 用矩阵的语言,
`f(x(v), w) = - f(v, x(w))` 可以写为 `x(v)^(sf T) s w = -v^(sf T) s x(w)`, 即 `s x = - x^(sf T) s`.
设 `m, n, p, q in bbb F^(n xx n)`, 则
`x = [m, n; p, q] in fr(sp)(2l, bbb F)` 当且仅当 `n, p` 为对称矩阵, 且 `m^(sf T) = -q`
(最后一个条件推出 `"tr"(x) = 0`).
`fr(sp)(V)` 的一个基底为
`m` 与 `q` 的部分: `e_(i j) - e_(l+j, l+i)`, `quad 1 le i le l`, `1 le j le l`,
`n` 的部分: `e_(i, l+j) + e_(j, l+i)`, `quad 1 le i le l`, `i le j le l`,
`p` 的部分: `e_(l+i, j) + e_(l+j, i)`, `quad 1 le i le l`, `i le j le l`.
共 `l^2 + 2 * (l(l+1))/2` `= 2l^2 + l` 个矩阵.
-
括积封闭性的证明与 1. 完全类似. 用矩阵的语言, 设 `m, n, p, q in bbb F^(n xx n)`, 则
`x = [a, b_1, b_2; c_1, m, n; c_2, p, q] in fr(o)(2l+1, bbb F)` 当且仅当 `s x = -x^(sf T) s`,
即:
`a = 0`, `c_1 = -b_2^(sf T)`, `c_2 = -b_1^(sf T)`, `m^(sf T) = -q`,
`n^(sf T) = -n`, `p^(sf T) = -p`.
(以上条件同样蕴含 `"tr"(x) = 0`.
`fr(o)(V)` (`"dim"V=2l+1`) 的一个基底为
主对角线: `e_(i i) - e_(l+i,l+i)`, `quad 2 le i le l+1`,
`b_2` 与 `c_1`: `e_(1, l+i+1) - e_(i+1, 1)`, `quad 1 le i le l`,
`b_1` 与 `c_2`: `e_(1, i+1) - e_(l+i+1, 1)`, `quad 1 le i le l`,
`m^(sf T) = -q`: `e_(i+1,j+1) - e_(l+j+1, l+i+1)`, `quad 1 le i != j le l`,
`n` 反对称: `e_(i+1,l+j+1) - e_(j+1, l+i+1)`, `quad 1 le i lt j le l`,
`p` 反对称: `e_(i+l+1, j+1) - e_(j+l+1, i+1)`, `quad 1 le j lt i le l`.
共 `3 l + l^2-l + 2*(l(l-1))/2` `= 2l^2 + l` 个矩阵.
- 证明与 2. 类似, 基底中共 `2l^2 - l` 个矩阵.
- `fr(t)(n, bbb F)` 是上三角矩阵构成的 Lie 代数.
- `fr(n)(n, bbb F)` 是严格上三角矩阵构成的 Lie 代数.
- `fr(d)(n, bbb F)` 是对角矩阵构成的 Lie 代数.
理想与同态
本节的内容与群论、环论的相关内容平行.
设 `L` 是 Lie 代数, `I le L`, 若对任意 `x in I`, `y in L` 有 `[x, y] in I`, 则称 `I` 是 `L` 的理想,
记为 `I normal L`.
- `L normal L`, `0 normal L` 是平凡的理想.
- 中心 `Z(L) := { x in L: AA y in L, [x, y] = 0 }` 是 `L` 的理想.
- `I, J` 是 `L` 的理想, 则 `I+J`, `I nn J`,
`[I,J] := { sum [x_i, y_j]: x_i in I, y_i in J }`
皆是 `L` 的理想.
如果 Lie 代数 `L` 的括积是非平凡的 (存在 `x, y` 使得 `[x, y] != 0`), 且 `L` 只有平凡的理想,
则称 `L` 是单的.
`L` 是单的, 意味着 `Z(L) = 0`, `[L, L] = L`.
只需说明 `Z(L) != L`, `[L, L] != 0`.
这由 `L` 的括积非平凡保证.
指数映射与切空间
矩阵范数
矩阵范数 是一个实函数 `||*||: bbb F^(n xx n) to RR` (`bbb F = RR, CC, bbb H`), 满足
- 正定性: `||A|| ge 0`, `||A|| = 0 iff A = 0`;
- 次可加性: `||A + B|| le ||A|| + ||B||`;
- 齐次性: `||k A|| = |k| ||A||`, `AA k in bbb F`.
比如, `|A| := sqrt(sum_(i, j) |a_(i j)|^2)` 就是这样一个范数. 今后我们将默认使用这个矩阵范数.
只验证次可加性 (Minkowski 不等式):
`(sqrt(sum |a_(i j)|^2) + sqrt(sum |b_(i j)|^2))^2`
`= sum |a_(i j)|^2 + sum |b_(i j)|^2 + 2 sqrt((sum |a_(i j)|^2)(sum |b_(i j)|^2))`
`ge sum |a_(i j)|^2 + sum |b_(i j)|^2 + 2 sum |a_(i j)| |b_(i j)|` (Cauchy 不等式)
`= sum |a_(i j) + b_(i j)|^2`.
矩阵范数的次可乘性 `|A B| le |A| |B|`.
特别 `|A^n| le |A|^n`.
记 `C = A B`, 使用 Cauchy 不等式,
`|C|^2 = sum_(i j) |c_(i j)|^2 = sum_(i j) |sum_k a_(i k) b_(k j)|^2`
`le sum_(i j) (sum_k |a_(i k)|^2)(sum_k |b_(k j)|^2)`
`= sum_i sum_k |a_(i k)|^2 sum_j sum_k |b_(k j)|^2`
`= |A| |B|`.
矩阵指数
矩阵指数用级数定义为
`exp(A) = sum_(n ge 0) A^n/n!`,
其中 `A^0 = bb 1` (单位矩阵).
这个级数是绝对收敛的, 其范数可被常数项级数 `sum_(n ge 0) (|A|^n)/n!` 控制.
当 `A B` 可交换时, 有 `exp(A+B) = exp(A) exp(B)`.
Euler 公式
令 `theta in RR`.
- 复数情形: 记 `bb i = [, -1; 1, ]`, 则
`exp[, -theta; theta, ] = [cos theta, -sin theta; sin theta, cos theta]`,
即 `"e"^(theta bb i) = bb 1 cos theta + bb i sin theta`,
这说明矩阵指数的定义与复指数是兼容的;
反之, 任意单位复数 `z in S^1` 可以写为 `z = "e"^(theta bb i)`.
- 四元数情形: 令 `u` 是单位纯虚四元数, 即 `u in RR bb i + RR bb j + RR bb k`, 且 `|u| = 1`.
则 `"e"^(theta u) = cos theta + u sin theta`;
反之, 任意单位四元数 `q in S^3` 可以写为 `q = "e"^(theta u)`.
只需注意到 `bb i^2 = -bb 1`, `u^2 = -1`, 又级数绝对收敛, 所以重排后就得到 `cos` 和 `sin` 的级数.
反之, 令 `z = a + b bb i`, `a^2 + b^2 = 1`, 因此存在 `theta` 使 `a = cos theta`, `b = sin theta`.
于是 `z = cos theta + bb i sin theta`.
同理令 `q = a + b bb i + c bb j + d bb k`, `a^2 + b^2 + c^2 + d^2 = 1`, 存在
`theta` 使 `a = cos theta`, `sqrt(b^2 + c^2 + d^2) = sin theta`,
于是 `q = cos theta + u sin theta`, 其中 `u = (b bb i + c bb j + d bb k)/sqrt(b^2 + c^2 + d^2)`.
- `exp` 将直线 `RR bb i` 上的纯虚数映到单位圆 `SO(2) = S^1`, 且是满射.
- `exp` 将 `RR bb i + RR bb j + RR bb k` 中的纯虚四元数映到单位四元数 `Sp(1) = SU(2) = S^3`, 且是满射.
注意到 `RR bb i`, `RR bb i + RR bb j + RR bb k` 是平直空间, 而 `S^1, S^3` 等是弯曲空间, 前者可以看作后者在单位元 `bb 1` 处的切线 (切空间).
我们给出切空间的定义.
切空间
设 `G` 是矩阵 Lie 群, `A(t)` 是 `G` 中经过单位元 `bb 1` 的可微曲线, `A(0) = bb 1`.
则称 `A'(0)` 是曲线在单位元处的切向量. `G` 在 `bb 1` 处的切空间定义为
`T_(bb 1)(G) = { A'(0): A(t)" 是 "G" 中经过 "bb 1" 的可微曲线 "}`.
Lie 括积的几何意义
设 `u(s), v(t)` 是矩阵 Lie 群 `G` 在 `bb 1` 处的两条可微曲线, `u(0) = v(0) = bb 1`.
记
`w(s, t) = u(s) v(t) u(s)^-1`,
对于每一固定的 `s`, `w(s, t)` 都是一条通过 `bb 1` 的可微曲线. 关于 `t` 在 0 处求导, 就得到它在
`bb 1` 处的切向量 `x(s)`. 再令 `x(s)` 对 `s` 在 0 处求导, 由于矩阵 Lie 群对极限运算封闭, 可知
`x'(0)` 也位于切空间 `T_(bb 1)(G)` 中. 这连续两次求导的结果, 正好就是 Lie 括积:
`{:del/(del s)|_(s=0) {:del/(del t)|_(t=0) w(s, t)`
`= [u'(0), v'(0)]`.
因此 Lie 括积一定程度上反映了 Lie 群中的共轭运算 `A B A^-1`.
`{:del/(del s)|_(s=0) {:del/(del t)|_(t=0) w(s, t)`
`= {:del/(del s)|_(s=0) u(s) v'(0) u(s)^-1`
`= {:u'(s) v'(0) u(s)^-1 + u(s) v'(0) (-u'(s) u(s)^-2)|_(s=0)`
`= u'(0) v'(0) - v'(0) u'(0)`
`= [u'(0), v'(0)]`.