导子与 Lie 括积

[来自 给大一学生的 Lie 代数]

在微积分中, "微分", 或 "求导" 是典型的线性运算: `(k f + l g)' = k f' + l g'`, 它最具特色的性质就是乘积的求导公式 `(f g)' = f'g + f g'`. 我们将 "求导" 运算推广到线性空间中来, 首先要求线性空间中有定义 "乘积". 事实上, 许多常见的线性空间都有定义乘积. 如 `bbb F[x]` 中的多项式乘法, `C^oo(a,b)` 中函数的逐点乘法, `bbb F^(n xx n)` 中的矩阵乘法, 乃至 `"End"V` (`V` 上全体线性变换) 中线性变换间的乘法. 由此给出导子的定义:

设 `V` 是定义了乘法的线性空间, 若 `V` 上线性变换 `D` 满足 `D(f g) = D(f) g + f D(g)`, `quad AA f, g in V`, 则称 `D` 是 `V` 的导子. `V` 中全体导子 `"Der"V` 按线性变换的加法和数乘构成 `"End"V` 的线性子空间.

对于线性空间 `V` 上的乘法, 我们不要求它可交换, 甚至也不要求它具有结合律, 只要求它是满足封闭性的二元运算即可. 这样的二元运算称为一个代数.

若 `A, B in "DerV`, 则 `A B - B A in "Der"V`.

`AA f, g in V`, `(A B - B A) (f g)`
`= A B(f g) - B A(f g)`
`= A(B(f)g + f B(g)) - B(A(f)g + f A(g))`
`= A B(f)g + B(f)A(g) + A(f)B(g) + f A B(g)`
`quad - B A(f)g - A(f)B(g) - B(f)A(g) - f B A(g)`
`= (A B-B A)(f)g + f(A B-B A)(g)`.

这个 `A B - B A` 如此好用, 以至于有如下定义:

设 `V` 是定义了代数的线性空间, `A, B in V`. 称 `[A, B] := A B - B A` Lie 括积, 简称括积.

    Lie 括积满足:
  1. 双线性性: `[k A + l B, C] = k [A, C] + l[B, C]`, `[A, k B + l C] = k[A, B] + l[A, C]`;
  2. 反对称性 `[A, B] = -[B, A]`;
  3. 二重公式 `[A, B C] = [A, B]C + B[A, C]`;
  4. Jacobi 恒等式 `sum_"cyc"[[A, B], C] = 0`.

4 的证明: `sum_"cyc" (A B-B A)C - C(A B-B A)` `= sum_"cyc" (A B C - C A B) + sum_"cyc" (C B A - B A C)` `= 0 + 0`.

    `RR^3` 中的向量外积也满足类似的性质:
  1. `bm x xx bm y = -bm y xx bm x`;
  2. `(k bm x + l bm y) xx bm z = k bm x xx bm z + l bm y xx bm z`;
  3. `bm x xx (bm y xx bm z) = (bm x * bm z) bm y - (bm x * bm y) bm z`.
  4. `sum_"cyc" (bm x xx bm y) xx bm z = bb 0`.
    在 `bbb F^(n xx n)` 中:
  1. 若 `A, B` 是反对称矩阵, 则 `[A, B]` 是反对称矩阵;
  2. 若 `A, B` 是对称矩阵, 则 `[A, B]` 是反对称矩阵;
  3. 若 `A, B` 一个对称, 一个反对称, 则 `[A, B]` 对称.
  4. 总之, 用 1 表示反对称, -1 表示对称, 欲知括积的对称性, 只需将两数相乘. 性质 1. 是重要的, 它指出 Lie 括积的运算在反对称矩阵中封闭.

下面的定理将括积和导子再次联系到一起.

在 `V` 上定义 `"ad"_A(B) = [A, B]`, 则 `"ad"_A in "Der"V`; 反之, 对任意 `D in "Der"V`, 存在 `A in V` 使得 `D = "ad"_A`.

  1. 由括积的性质 3, `"ad"_A(B C) = "ad"_A(B) C + B "ad"_A(C)`, 即 `"ad"_A` 是导子.
  2. ??

Lie 代数

    `bbb F` 上的线性空间 `V` 上的一个二元运算 `[A, B]`, 如果对任意 `A, B, C in V` 成立:
  1. 双线性性: `[k A + l B, C] = k [A, C] + l[B, C]`, `[A, k B + l C] = k[A, B] + l[A, C]`, `k, l in bbb F`;
  2. 反对称性: `[A, B] = -[B, A]`;
  3. Jacobi 恒等式: `sum_"cyc"[[A, B], C] = 0`.
  4. 则称 `[A, B]` 是 `V` 上的一个 Lie 括积. `V` 连同其上的 Lie 括积一起构成一个 Lie 代数.

今后没有特别说明的情况下, 矩阵构成的线性空间, 如 `CC^(n xx n)` 上面的 Lie 括积统一定义为 `[A, B] = A B - B A`.

    记 `e_(i j)` 是 `i` 行 `j` 列为 1, 其它位置为 0 的 `n xx n` 矩阵.
  1. 令 `A` 是 `n xx n` 矩阵, 则 `A e_(i j) = "把 "A" 的第 i 列粘贴到零矩阵的第 j 列`,
    `e_(i j) A = "把 "A" 的第 j 行粘贴到零矩阵的第 i 行`.
    因此 `[A, e_(i j)] = A e_(i j) - e_(i j) A` `= [ , , a_(1 i); , , vdots; -a_(j 1), cdots, a_(i i) - a_(j j), cdots, -a_(j n); , , vdots; , , a_(n i) ]`.
  2. `e_(RED i BLUE j) e_(BLUE k RED l) = delta_(BLUE(j k)) e_(RED(i l))`, 因此 `[e_(RED i BLUE j), e_(BLUE k RED l)] = delta_(BLUE(j k)) e_(RED(i l)) - delta_(RED(l i)) e_(BLUE(k j))` `= { 0, if j != k and i != l; e_(RED(i l)), if j = k and i != l; -e_(BLUE(k j)), if j != k and i = l; e_(RED(i i)) - e_(BLUE(j j)), if j = k and i = l; :}`
  3. 记 `E_(i j) = e_(i j) - e_(j i)`, 它是反对称矩阵, `E_(i j) + E_(j i) = 0`, `E_(i i) = 0`. 利用 `[A, E_(i j)] = [A, e_(i j)] - [A, e_(j i)]`, 我们有 `[A, E_(i j)] = {: , {: ,,,,,,,,,,, i ,,,,,,, j; :}; {: ;;i;;j;; :}, [ ,,,-a_(1 j),,a_(1 i); ,,,-a_(2 j),,a_(2 i); ,,,vdots,,vdots; -a_(j 1),-a_(j 2),...,-a_(j i)-a_(i j),...,-a_(j j)+a_(i i),...,-a_(j n); ,,,vdots,,vdots; a_(i 1),a_(i 2),...,a_(i i)-a_(j j),...,a_(i j)+a_(j i),...,a_(i n); ,,,vdots,,vdots; ,,,-a_(n j),,a_(n i) ] :}`.
  4. 暴力展开得到 `[E_(i j), E_(k l)]` `= delta_(j k) E_(i l) + delta_(i l) E_(j k) + delta_(k i) E_(l j) + delta_(l j) E_(k i)`. 特别 `i, j, k` 两两不等时, `[E_(i j), E_(j k)] = E_(i k)`, `quad [E_(i j), E_(k i)] = E_(j k)`. `i, j, k, l` 两两不等时, `[E_(i j), E_(k l)] = 0`.
  5. 记 `tilde E_(i j) = e_(i j) + e_(j i)`, 它是对称矩阵, `E_(i j) = E_(j i)`.

指数映射与切空间

指数映射架起了 Lie 群和 Lie 代数之间的桥梁. 通过指数映射, 我们把一个研究弯曲空间 (Lie 群) 的问题, 简化为研究它的切空间 (Lie 代数).

矩阵范数

    矩阵范数 是一个实函数 `||*||: bbb F^(n xx n) to RR` (`bbb F = RR, CC, bbb H`), 满足
  1. 正定性: `||A|| ge 0`, `||A|| = 0 iff A = 0`;
  2. 次可加性: `||A + B|| le ||A|| + ||B||`;
  3. 齐次性: `||k A|| = |k| ||A||`, `AA k in bbb F`.
  4. 比如, `|A| := sqrt(sum_(i, j) |a_(i j)|^2)` 就是这样一个范数. 今后我们将默认使用这个矩阵范数.

只验证次可加性 (Minkowski 不等式): `(sqrt(sum |a_(i j)|^2) + sqrt(sum |b_(i j)|^2))^2`
`= sum |a_(i j)|^2 + sum |b_(i j)|^2 + 2 sqrt((sum |a_(i j)|^2)(sum |b_(i j)|^2))`
`ge sum |a_(i j)|^2 + sum |b_(i j)|^2 + 2 sum |a_(i j)| |b_(i j)|` (Cauchy 不等式)
`= sum |a_(i j) + b_(i j)|^2`.

矩阵范数的次可乘性 `|A B| le |A| |B|`. 特别 `|A^n| le |A|^n`.

记 `C = A B`, 使用 Cauchy 不等式, `|C|^2 = sum_(i j) |c_(i j)|^2 = sum_(i j) |sum_k a_(i k) b_(k j)|^2` `le sum_(i j) (sum_k |a_(i k)|^2)(sum_k |b_(k j)|^2)` `= sum_i sum_k |a_(i k)|^2 sum_j sum_k |b_(k j)|^2` `= |A| |B|`.

矩阵指数

矩阵指数用级数定义为 `exp(A) = sum_(n ge 0) A^n/n!`, 其中 `A^0 = bb 1` (单位矩阵). 这个级数是绝对收敛的, 其范数可被常数项级数 `sum_(n ge 0) (|A|^n)/n!` 控制.

当 `A B` 可交换时, 有 `exp(A+B) = exp(A) exp(B)`.

    Euler 公式 令 `theta in RR`.
  1. 复数情形: 记 `bb i = [, -1; 1, ]`, 则 `exp[, -theta; theta, ] = [cos theta, -sin theta; sin theta, cos theta]`, 即 `"e"^(theta bb i) = bb 1 cos theta + bb i sin theta`, 这说明矩阵指数的定义与复指数是兼容的; 反之, 任意单位复数 `z in S^1` 可以写为 `z = "e"^(theta bb i)`.
  2. 四元数情形: 令 `u` 是单位纯虚四元数, 即 `u in RR bb i + RR bb j + RR bb k`, 且 `|u| = 1`. 则 `"e"^(theta u) = cos theta + u sin theta`; 反之, 任意单位四元数 `q in S^3` 可以写为 `q = "e"^(theta u)`.

只需注意到 `bb i^2 = -bb 1`, `u^2 = -1`, 又级数绝对收敛, 所以重排后就得到 `cos` 和 `sin` 的级数.
反之, 令 `z = a + b bb i`, `a^2 + b^2 = 1`, 因此存在 `theta` 使 `a = cos theta`, `b = sin theta`. 于是 `z = cos theta + bb i sin theta`.
同理令 `q = a + b bb i + c bb j + d bb k`, `a^2 + b^2 + c^2 + d^2 = 1`, 存在 `theta` 使 `a = cos theta`, `sqrt(b^2 + c^2 + d^2) = sin theta`, 于是 `q = cos theta + u sin theta`, 其中 `u = (b bb i + c bb j + d bb k)/sqrt(b^2 + c^2 + d^2)`.

  1. `exp` 将直线 `RR bb i` 上的纯虚数映到单位圆 `SO(2) = S^1`, 且是满射.
  2. `exp` 将 `RR bb i + RR bb j + RR bb k` 中的纯虚四元数映到单位四元数 `Sp(1) = SU(2) = S^3`, 且是满射.
  3. 注意到 `RR bb i`, `RR bb i + RR bb j + RR bb k` 是平直空间, 而 `S^1, S^3` 等是弯曲空间, 前者可以看作后者在单位元 `bb 1` 处的切线 (切空间).

我们给出切空间的定义.

切空间

设 `G` 是矩阵 Lie 群, `A(t)` 是 `G` 中经过单位元 `bb 1` 的可微曲线, `A(0) = bb 1`. 则称 `A'(0)` 是曲线在单位元处的切向量. `G` 在 `bb 1` 处的切空间定义为 `T_(bb 1)(G) = { A'(0): A(t)" 是 "G" 中经过 "bb 1" 的可微曲线 "}`.

Lie 括积的几何意义 设 `u(s), v(t)` 是矩阵 Lie 群 `G` 在 `bb 1` 处的两条可微曲线, `u(0) = v(0) = bb 1`. 记 `w(s, t) = u(s) v(t) u(s)^-1`, 对于每一固定的 `s`, `w(s, t)` 都是一条通过 `bb 1` 的可微曲线. 关于 `t` 在 0 处求导, 就得到它在 `bb 1` 处的切向量 `x(s)`. 再令 `x(s)` 对 `s` 在 0 处求导, 由于矩阵 Lie 群对极限运算封闭, 可知 `x'(0)` 也位于切空间 `T_(bb 1)(G)` 中. 这连续两次求导的结果, 正好就是 Lie 括积: `{:del/(del s)|_(s=0) {:del/(del t)|_(t=0) w(s, t)` `= [u'(0), v'(0)]`. 因此 Lie 括积一定程度上反映了 Lie 群中的共轭运算 `A B A^-1`.

`{:del/(del s)|_(s=0) {:del/(del t)|_(t=0) w(s, t)`
`= {:del/(del s)|_(s=0) u(s) v'(0) u(s)^-1`
`= {:u'(s) v'(0) u(s)^-1 + u(s) v'(0) (-u'(s) u(s)^-2)|_(s=0)`
`= u'(0) v'(0) - v'(0) u'(0)`
`= [u'(0), v'(0)]`.