线性映射与同构映射

线性映射

令 `V`, `W` 都是数域 `bbb P` 上的线性空间, 称映射 `f: V to W` 为 `V` 到 `W` 的一个线性映射, 如果 `f` 保持加法和数乘运算, 即对任意 `bm alpha, bm beta in V` 和任意 `k in bbb P`, `f(bm alpha + bm beta) = f(bm alpha) + f(bm beta)`, `quad f(k bm alpha) = k f(bm alpha)`. 或等价地, 对任意 `bm alpha, bm beta in V` 和任意 `k, l in bbb P`, `f(k bm alpha + l bm beta) = k f(bm alpha) + l f(bm beta)`. `V` 到 `W` 的全体线性映射记为 `L(V,W)`. 特别地, 若 `V = W`, 则称 `f` 为 `V` 上的线性变换. `V` 上全体线性变换记为 `L(V)` 或 `End(V)`. 我们将在下节讨论线性变换.

设 `f` 是线性空间 `V` 到 `W` 的一个线性映射, 则对任意 `bm alpha_i in V`, `k_i in bbb P`, `i = 1, 2, cdots, n` 有 `f(sum_(i=1)^n k_i bm alpha_i) = sum_(i=1)^n k_i f(bm alpha_i)`. 特别取 `n = 1`, `k_1 = -1` 有 `(AA bm alpha in V)` `f(-bm alpha) = -f(bm alpha)`. 取 `n = 1`, `k_1 = 0` 有 `f(bm theta_V) = bm theta_W`.

线性相关向量组在线性映射下的像也线性相关.

定义 `f` 的分别为 `"Im"f := {f(bm alpha) | bm alpha in V}`,
`"Ker"f := {bm alpha in V | f(bm alpha) = bm theta}`.
于是, `f` 为满射 `iff "Im"f = W`, `f` 为单射 `iff "Ker"f = {bm theta}`.

我们来证 `f` 为单射 `iff "Ker"f = {bm theta}`. "`rArr`": 显然 `bm theta in "Ker"f`, 由 `f` 为单射知 `"Ker"f` 中只有 `bm theta`.
"`lArr`": `f(bm alpha) = f(bm beta)` `rArr f(bm alpha - bm beta) = bm theta` `rArr bm(alpha-beta) in "Ker"f` `rArr bm(alpha-beta) = bm theta` `rArr bm alpha = bm beta`. 因此 `f` 为单射.

    我们给出两个特殊的线性映射.
  1. 将线性空间 `V` 中任意向量都映到 `bm theta` 的映射称为零映射, 记为 `bb 0`, 这是一个线性映射. `"Im"bb 0 = {bm theta}`, `"Ker"bb 0 = V`.
  2. 将线性空间 `V` 中任意向量都映到自身的映射称为恒等映射, 记为 `bb I`, 这是一个线性映射. `"Im"bb I = V`, `"Ker"bb I = {bm theta}`.
  3. 事实上两个映射都是线性变换, 所以又称为零变换和恒等变换.

线性映射的像 (原像) 仍为一线性空间. 设 `f` 是线性空间 `V` 到 `W` 的一个线性映射, `V_1 le V`, `W_1 le W`, 则 `f(V_1) le W`, `quad f^-1(W_1) le V`. 特别有 `"Im"f le W`, `"Ker"f le V`.

任取 `f(bm alpha), f(bm beta) in f(V_1)`, 其中 `bm alpha, bm beta in V_1`, 从而对任意 `k in bbb P`, `f(bm alpha) + f(bm beta) = f(bm alpha + bm beta) in f(V_1)`,
`k f(bm alpha) = f(k bm alpha) in f(V_1)`.
因此 `f(V_1) le W`. 又任取 `bm gamma, bm delta in f^-1(W_1)`, 则 `f(bm gamma), f(bm delta) in W_1`, 从而 `f(bm gamma + bm delta) = f(bm gamma) + f(bm delta) in W_1`,
`f(k bm gamma) = k f(bm gamma) in W_1`.
所以 `bm gamma + bm delta, k bm gamma in f^-1(W_1)`, 于是 `f^-1(W_1) le V`.

同构映射

称 `f` 为 `V` 到 `W` 的一个同构映射, 如果它是线性映射, 且为双射. 存在 `V` 到 `W` 的同构映射时, 就称 `V` 与 `W` 同构, 记为 `V ~= W`.

数域 `bbb P` 上线性空间的同构满足自反性, 对称性和传递性, 因此是一等价关系.

    设 `U, V, W` 都是 `bbb P` 上的线性空间, `f: U to V`, `g: V to W` 为同构映射.
  1. `U` 上的恒等映射是一同构映射, 故 `U ~= U`. 这证明了自反性.
  2. 显然 `f^-1` 为双射; 任取 `bm alpha, bm beta in V` 和 `k, l in bbb P`, `f f^-1(k bm alpha + l bm beta)` `= k bm alpha + l bm beta` `= k f f^-1(bm alpha) + l f f^-1(bm beta)` `= f(k f^-1(bm alpha) + l f^-1(bm beta))`. 由 `f` 是单射得 `f^-1(k bm alpha + l bm beta) = k f^-1(bm alpha + l f^-1(bm beta))`, 因此 `f^-1` 是同构映射. 这证明了对称性.
  3. 显然 `g @ f: U to W` 是双射, 同理容易验证它保持加法和数乘, 因此是同构映射. 这证明了传递性.

数域 `bbb P` 上任意 `n` 维线性空间同构于 `bbb P^n`,

任取 `V` 的一个基底, 则任意 `bm alpha in V` 都唯一确定一个坐标 `bm X in bbb P`. 这一映射保持加法和数乘, 且为一双射, 因此是同构映射.

数域 `bbb P` 上两个有限维线性空间同构当且仅当它们维数相等.

充分性: 设它们的维数都等于 `n`, 则它们都同构于 `bbb P^n`. 必要性: 设 `V ~= W`, `bm alpha_1, cdots, bm alpha_n` 是 `V` 的一个基, 则 `f(bm alpha_1), cdots, f(bm alpha_n)` 线性无关, 是 `W` 的一个基; 反之亦然.

线性变换

线性变换的表示矩阵

令 `V` 为数域 `bbb P` 上一线性空间, 线性映射 `cc A: V to V` 称为 `V` 上的线性变换. `V` 上全体线性变换记为 `L(V)`. `V` 中向量 `bm alpha` 在线性变换 `cc A` 下的像简单记为 `cc A bm alpha := cc A(bm alpha)`.
现在取 `V` 的基 `"I" = (bm epsi_1, bm epsi_2, cdots, bm epsi_n)`, `AA cc A in L(V)`, 设 `cc A bm epsi_j = sum_(i=1)^n a_(i j) bm epsi_i`, `quad j = 1, 2, cdots, n`. 记 `bm A = (a_(i j))_(n xx n)` `= (bm A_1, bm A_2, cdots, bm A_n)`, 上式形式地记为 `(cc A bm epsi_1, cc A bm epsi_2, cdots, cc A bm epsi_n)` `= (bm epsi_1, bm epsi_2, cdots, bm epsi_n) bm A`, 其中 `cc A bm epsi_j = (bm epsi_1, bm epsi_2, cdots, bm epsi_n)bm A_j`, `quad j = 1, 2, cdots, n`. 矩阵 `bm A` 称为线性变换 `cc A` 在基底 `"I"` 下的表示矩阵, 简称为 `cc A` 在 `"I"` 下的矩阵. 这一表达式与线性空间的坐标变换类似, 但这里表示矩阵未必像过渡矩阵那样可逆. 注意, 有了线性变换的表示矩阵后, 任一向量 `bm alpha = sum_(i=1)^n x_i bm epsi_i` `= (bm epsi_1, bm epsi_2, cdots, bm epsi_n) bm X` 在 `cc A` 下的的像都可以确定了: `cc A bm alpha = cc A(sum_(i=1)^n x_i bm epsi_i)` `= sum_(i=1)^n x_i cc A bm epsi_i` `= (cc A bm epsi_1, cc A bm epsi_2, cdots, cc A bm epsi_n) bm X` `= (bm epsi_1, bm epsi_2, cdots, bm epsi_n) bm(A X)`, 这就是说 `cc A bm alpha` 在基底 `"I"` 下的坐标为 `bm(A X)`.

从上文的推导过程看出, `cc A[(bm epsi_1, bm epsi_2, cdots, bm epsi_n) bm X]` `= (cc A bm epsi_1, cc A bm epsi_2, cdots, cc A bm epsi_n)bm X`. 这是一个实用公式. 容易看出, 当 `bm X` 不是向量, 而是矩阵时, 公式也适用.

线性变换在不同基底下的矩阵是相似的 令 `V` 为线性空间, `"I" = (bm xi_1, bm xi_2, cdots, bm xi_n)`, `"II" = (bm eta_1, bm eta_2, cdots, bm eta_n)` 是它的两个基, 且 `"II" = "I" bm T`. 又设 `cc A in L(V)` 在 `"I"` 下的矩阵为 `bm A`, 则它在 `"II"` 下的矩阵为 `bm(T^-1 A T)`. 反之, 相似的两个矩阵可以视为同一线性变换在不同基底下的矩阵.

直接计算 `(cc A bm eta_1, cc A bm eta_2, cdots, cc A bm eta_n)` `= (cc A bm eta_1, cc A bm eta_2, cdots, cc A bm eta_n)bm I` `= cc A[(bm eta_1, bm eta_2, cdots, bm eta_n)bm I]` `= cc A[(bm xi_1, bm xi_2, cdots, bm xi_n)bm T]` `= (bm xi_1, bm xi_2, cdots, bm xi_n)bm(A T)` `= (bm eta_1, bm eta_2, cdots, bm eta_n)bm(T^-1 A T)`.

线性变换的若干合成

类比于向量. 给定线性空间 `V` 的一个基, 则 `V` 中向量与其在给定基底下的坐标一一对应. 这引出 `V` 与 `bbb P^n` 的同构关系. 同理, `V` 上的线性变换与其在基底下的矩阵一一对应. 于是 `L(V)` 与 `bbb P^(n xx n)` 同构. 我们通过适当地定义 `L(V)` 上的合成, 来达到这一目的.

    设 `V` 是数域 `bbb P` 上一线性空间.
  1. 数乘. `AA bm alpha in V`, `AA cc A in L(V)`, `AA k in bbb P`, 定义 `(k cc A)bm alpha = k(cc A bm alpha)`.
  2. 加法. `AA bm alpha in V`, `AA cc A, cc B in L(V)`, 定义 `(cc A + cc B)bm alpha = cc A bm alpha + cc B bm alpha`. 引进 `-cc A := -1 cc A`, 从而减法定义为 `cc A-cc B = cc A + (-cc B)`.
  3. 可以验证数乘与加法的结果仍是 `V` 上的线性变换, 且 `L(V)` 关于此加法与数乘构成 `bbb P` 上一线性空间. 特别 `"dim"V = n` 时, `"dim"L(V) = n^2`. 可以验证 `L(V)` 同构于 `bbb P^(n xx n)`.
  4. 乘法, 或复合. `AA bm alpha in V`, `AA cc A, cc B in L(V)`, 定义 `(cc(A B))bm alpha = cc A(cc B bm alpha)`. 可以验证 `cc(A B) in L(V)`.
  5. 最后, 当 `cc A, cc B` 在 `V` 的某一个基下的矩阵分别为 `bm A, bm B` 时, `k cc A`, `cc(A+B)`, `cc(A B)` 在同一个基下的矩阵分别为 `k bm A`, `bm(A+B)`, `bm(A B)`.

线性变换可逆的等价条件

称线性空间 `V` 到自身的同构映射为一自同构变换. 由定义, 自同构变换即为可逆的线性变换.

    设 `V` 为 `bbb P` 上的 `n` 维线性空间, `cc A in L(V)`, 则以下各款等价:
  1. `cc A` 为一单射;
  2. `cc A` 为一满射;
  3. `cc A` 为一双射, 即 `cc A` 为一自同构变换;
  4. `cc A` 在 `V` 的任意基底下的矩阵可逆;
  5. `cc A` 在 `V` 的某个基底下的矩阵可逆;
  6. 线性无关向量组在 `cc A` 下的像依然线性无关.
  1. `rArr` 2. 反设 `cc A` 不是满射, 则 `"dim"cc A(V) lt "dim"V = n`. 于是, 对 `V` 的任一极大无关向量组 `bm alpha_1, bm alpha_2, cdots, bm alpha_n`, 有 `cc A bm alpha_1, cc A bm alpha_2, cdots, cc A bm alpha_n` 线性相关. 从而, 存在不全为零的 `k_1, cdots, k_n in bbb P`, 使得 `bm theta = sum_(i=1)^n k_i cc A bm alpha_i` `= cc A(sum_(i=1)^n k_i bm alpha_i)` 从而 `bm theta != sum_(i=1)^n k_i bm alpha_i in "Ker"cc A`, 与 `cc A` 是单射矛盾.
  2. `rArr` 3. 只需证 2 `rArr` 1. 反设 `cc A` 不是单射, 则存在非零的 `bm alpha_1 in "Ker"cc A`. 扩充 `{bm alpha_1}` 为 `V` 的基 `(bm alpha_1, bm alpha_2, cdots, bm alpha_n)`, 于是 `"Im"cc A = cc A(G[bm alpha_1, bm alpha_2, cdots, bm alpha_n])` `= G[cc A bm alpha_1, cc A bm alpha_2, cdots, cc A bm alpha_n]` `= G[bm theta, cc A bm alpha_2, cdots, cc A bm alpha_n] lt V`, 与 `cc A` 是满射矛盾.
  3. `rArr` 4. 由已知 `cc A^-1` 存在, 即 `cc(A A^-1) = cc(A^-1 A) = bb I`. 任取 `V` 的一个基, 记 `cc A`, `cc A^-1` 在该基底下的矩阵为 `bm A, bm B`, 则 `bm(A B) = bm(B A) = bm I`. 于是 `bm A` 可逆.
  4. `rArr` 5. 显然. 反之由线性变换在不同基底下的矩阵的相似关系, 还有 5 `rArr` 4, 因此 4 `iff` 5.
  5. `rArr` 6. 任取线性无关的向量组 `bm alpha_1, bm alpha_2, cdots, bm alpha_r in V`, 扩充为 `V` 的基 `(bm alpha_1, cdots, bm alpha_n)`, 记 `cc A` 在该基底下的矩阵为 `bm A`, 即 `(cc A bm alpha_1, cc A bm alpha_2, cdots, cc A bm alpha_n)` `= (bm alpha_1, bm alpha_2, cdots, bm alpha_n) bm A`. 由 `bm A` 可逆知, `bm A` 可以分解为有限个初等矩阵的乘积, 从而 `cc A bm alpha_1, cc A bm alpha_2, cdots, cc A bm alpha_n` 可视为初等变换的结果, 因此线性无关. 从而原向量组线性无关.
  6. `rArr` 1. 若 `cc A` 非单射, 则存在非零向量 `bm alpha in "Ker"cc A`. 即 `cc A` 把线性无关的 `bm alpha` 变为线性相关的 `bm theta` 了, 矛盾.

线性空间的直和分解

设 `f` 是线性空间 `V` 到 `W` 的一个线性映射, 且 `f` 不为零映射, 也不为单射. `(bm alpha_1, bm alpha_2, cdots, bm alpha_r)` 是 `"Ker"f` 的一个基. 由已知 `0 lt r lt "dim"V`. 任取 `bm alpha_(r+1), cdots, bm alpha_n in V`, 则 `{bm alpha}_(i=1)^n` 线性相关当且仅当 `{f(bm alpha)}_(i=r+1)^n` 线性相关.

"`lArr`". 由已知, 存在不全为零的 `k_(r+1), cdots, k_n in bbb P`, 使得 `bm theta = sum_(i=r+1)^n k_i f(bm alpha_i)` `= f(sum_(i=r+1)^n k_i bm alpha_i)`, 即 `sum_(i=r+1)^n k_i bm alpha_i in "Ker"f`. 于是又存在 `k_1, k_2, cdots, k_r in bbb P`, 使得 `sum_(i=r+1)^n k_i bm alpha_i = sum_(i=1)^r k_i bm alpha_i`, 从而 `{bm alpha_i}_(i=1)^n` 线性相关.
"`rArr`". 由已知, 存在不全为零的 `k_1, k_2, cdots, k_n in bbb P`, 使得 `sum_(i=1)^n k_i bm alpha_i = bm theta`. 断言 `k_(r+1), cdots, k_n` 不全为零, 否则有 `sum_(i=1)^r k_i bm alpha_i = bm theta`, 再由 `{bm alpha_i}_(i=1)^r` 线性无关知 `k_1 = cdots = k_r = 0`, 进而 `k_1 = cdots = k_n = 0`, 矛盾. 现在注意到 `f(sum_(i=1)^r k_i bm alpha_i) = bm theta`, 所以 `sum_(i=r+1)^n k_i f(bm alpha_i)` `= f(sum_(i=r+1)^n k_i bm alpha_i) + bm theta` `= f(sum_(i=1)^n k_i bm alpha_i)` `= f(bm theta)` `= bm theta`. 即 `{f(bm alpha)}_(i=r+1)^n` 线性相关.

(Sylvester) 令 `f` 为有限维线性空间 `V` 到 `W` 的线性映射, 则 `"dimKer"f + "dimIm" f = "dim"V`.

不妨设 `"dim"V = n gt 0`. `f` 为单射时, `"dimKer"f = 0`, `"dimIm"f = n`. `f` 为零映射时, `"dimKer" f = n`, `"dimIm" f = 0`, 定理成立. 下面设 `f` 既不是单射, 又不是零映射, 取 `"Ker"f` 的基 `(bm alpha_1, bm alpha_2, cdots, bm alpha_r)`, `0 lt r lt n`, 将它扩充为 `V` 的基底 `(bm alpha_1, bm alpha_2, cdots, bm alpha_n)`. `AA bm alpha = sum_(i=1)^n k_i bm alpha_i`, 有 `f(bm alpha)` `= f(sum_(i=1)^r k_i bm alpha_i + sum_(i=r+1)^n k_i bm alpha_i)` `= sum_(i=r+1)^n k_i f(bm alpha_i)`, 从而 `"Im"f = G[f(bm alpha_(r+1)), cdots, f(bm alpha_n)]`. 由引理, `f(bm alpha_(r+1)), cdots, f(bm alpha_n)` 线性无关, 从而构成 `"Im"f` 的基, `"dimIm" f = n-r`. 于是定理的结论成立.

(参考群同态基本定理) 由于 `"Ker"f` 的基能够扩充为 `V` 的基, 由维数公式的推论, 存在子空间 `V_1 le V`, 使得 `V = V_1 o+ "Ker"f`.
考察 `V_1` 到 `"Im"f` 的线性映射 `f|_(V_1)`. 由于 `AA bm alpha + bm beta in V`, 其中 `bm alpha in V_1, bm beta in "Ker"f`, 有 `f(bm alpha + bm beta) = f(bm alpha) in f(V_1)`, 从而 `"Im"f sube f(V_1)`. 又显然 `f(V_1) sube f(V) = "Im"f`, 故 `"Im"f = f(V_1)`. 这指出 `f|_(V_1)` 是满射;
另一方面, `"Ker"(f|_(V_1)) = V_1 nn "Ker"f = {bm theta}`, 从而 `f|_(V_1)` 是单射. 综上有 `f|_(V_1)` 是 `V_1` 到 `"Im"f` 的同构映射, `V_1 ~= "Im"f`, 于是 `"dim"V = "dim"V_1 + "dimKer" f` `= "dimIm"f + "dimKer" f`.

从 Sylvester 定理的第二种证明看出, 存在一个同构于 `"Im"f` 的子空间 `V_1`, 使得 `V` 可以分解为 `V_1` 与 `"Ker"f` 的直和. 但一般不成立 `V = "Im"f o+ "Ker"f`.

设 `cc A in L(V)` 为幂等变换, 即 `cc A^2 = cc A`, 则 `V = "Im"f o+ "Ker"f`.

  1. 任取 `bm alpha in V`, 则 `cc A(bm alpha - cc A bm alpha)` `= cc A bm alpha - cc A^2 bm alpha` `= bm theta`, 故 `bm alpha - cc A bm alpha in "Ker"cc A`. `bm alpha = cc A bm alpha +(bm alpha - cc A bm alpha)` `in "Im"cc A + "Ker"cc A`. 这指出 `V = "Im"cc A + "Ker"cc A`.
  2. `AA bm alpha in "Im"cc A nn "Ker" cc A`, 于是 `(EE bm beta in V)` `cc A bm beta = bm alpha`, `quad cc A bm alpha = bm theta`. 所以 `bm theta = cc A bm alpha` `= cc A^2 bm beta = cc A bm beta` `= bm alpha`. 这指出 `"Im"cc A nn "Ker" cc A = {bm theta}`, 于是 `V = "Im"f o+ "Ker"f`.
    令 `cc A in L(V)` 在 `V` 的基 `(bm epsi_1, bm epsi_2, cdots, bm epsi_n)` 下的矩阵为 `bm A`, 则
  1. `"Im"cc A = G[cc A bm epsi_1, cc A bm epsi_2, cdots, cc A bm epsi_n]`;
  2. `r_(bm A) = "dimIm"cc A`.
    令 `V` 是 `bbb P` 上的线性空间, `cc A, cc B in L(V)`, 则
  1. `"Ker"cc A sube "Ker"cc B iff EE cc C in L(V), cc(C A) = cc B`;
  2. `"Im"cc B sube "Im"cc A iff EE cc C in L(V), cc(A C) = cc B`.
  3. 因此, `"Ker"cc A = "Ker" cc B` 当且仅当 `cc A`, `cc B` 互为右因子; `"Im"cc A = "Im"cc B` 当且仅当 `cc A`, `cc B` 互为左因子.
  1. "`lArr`": `AA bm alpha in "Ker" cc A`, 有 `cc A bm alpha = 0`, 则 `cc B bm alpha = cc(C A)bm alpha = cc C bm theta = bm theta`, 即 `bm alpha in "Ker" cc B`.
    "`rArr`": `"Ker"cc A = {bm theta}` 时, `cc A` 为一单射, 从而为一双射. 取 `cc C = cc(B A)^-1`, 就有 `cc(C A) = cc B`.
    `"Ker"cc A != {bm theta}` 时, 取 `"Ker"cc A` 的基 `(bm epsi_1, cdots, bm epsi_r)`, 扩充为 `V` 的基 `(bm epsi_1, cdots, bm epsi_n)`. 于是由 `"Ker"cc A sube "Ker"cc B` 有 `cc A bm epsi_1 = cdots = cc A bm epsi_r = bm theta`,
    `cc B bm epsi_1 = cdots = cc B bm epsi_r = bm theta`.
    由引理, `cc A bm epsi_(r+1), cdots, cc A bm epsi_n` 线性无关. 将这一无关组扩充为 `V` 的基 `(bm eta_1, cdots, bm eta_r, cc A bm epsi_(r+1), cdots, cc A bm epsi_n)`. 现在作线性变换 `cc C`: `cc C(bm eta_i) = bm theta`, `quad i = 1, 2, cdots, r`,
    `cc C(cc A bm epsi_i) = cc B bm epsi_i`, `quad i = r+1, cdots, n`.
    可以验证 `cc(C A) = cc B`.
  2. "`lArr`": `"Im"cc B = cc B(V) = cc(A C)(V)` `sube cc A(V) = "Im"cc A`.
    "`rArr`": `"Ker"cc B = {bm theta}` 时, `cc B` 为一单射, 从而为一满射, 于是 `"Im"cc A supe "Im"cc B = V`, 即 `cc A` 为一满射, 从而 `cc A` 为一双射. 取 `cc C = cc(A^-1 B)`, 就有 `cc(A C) = cc B`.
    `"Ker"cc B != {bm theta}` 时, 取 `"Ker"cc B` 的基 `(bm alpha_1, cdots, bm alpha_r)`, 扩充为 `V` 的基 `(bm alpha_1, cdots, bm alpha_n)`. 由 `"Im"cc B sube "Im"cc A` 有 `(EE bm beta_i in V)` `cc A bm beta_i = cc B bm alpha_i`,
    `i = r+1, cdots, n`.
    现在作线性变换 `cc C`: `cc C bm alpha_i = { bm theta, if i = 1","2","cdots","r; bm beta_i, if i = r+1","cdots","n; :}` 可以验证 `cc(A C) = cc B`.