令 `bbb P` 为一数域, `bbb P` 上 `m` 行 `n` 列矩阵的全体记为 `bbb P^(m xx n)`, `bbb P` 称为矩阵的基础数域. 如果 `m xx n` 矩阵 `bm A = (a_(i j))` 和 `bm B = (b_(i j))` 满足 `a_(i j) = b_(i j)`, `quad i = 1, cdots, m,` `quad j = 1, cdots, n`, 则称它们相等, 记为 `bm A = bm B`.
矩阵乘法 令 `bm A = (a_(i j))_(m xx r)`, `bm B = (b_(i j))_(r xx n)`. 定义 `bm (A B) := (c_(i j))_(m xx n)`, 其中 `c_(i j) = sum_(k=1)^r a_(i k) b_(k j)`, `quad i = 1, cdots, m,` `quad j = 1, cdots, n`. 这一乘法法则称为 "左行乘右列", 即矩阵 `bm (A B)` 的 `i j` 元由 `bm A` 的第 `i` 行与 `bm B` 的第 `j` 列作向量的一般内积得到: `{: {::}, [, b_(1 j), ; vdots, vdots, vdots; , b_(r j), ; ]; [, cdots, ; a_(i 1), cdots, a_(i r); , cdots, ; ], [*, *, *; *, c_(i j), *; *, *, *; ] :}`
为何这样定义矩阵乘法呢, 考虑两个线性函数组
`y_k = sum_(j=1)^n b_(k j) x_j`, `quad k = 1, cdots, r`,
`z_i = sum_(k=1)^r a_(i k) y_k`, `quad i = 1, cdots, m`.
代入得
`z_i = sum_(k=1)^r a_(i k) sum_(j=1)^n b_(k j) x_j`
`= sum_(j=1)^n x_j sum_(k=1)^r a_(i k) b_(k j)`
`= sum_(j=1)^n c_(i j) x_j`.
从而, 矩阵乘法反映了线性函数组的复合.
矩阵乘法一般不成立交换律, 如 `bm A, bm B` 分别是 `m xx n`, `n xx m`
矩阵, 则 `bm (A B)` 是 `m` 阶方阵, 而 `bm (B A)` 是 `n` 阶方阵,
因此两个矩阵的乘法可交换的必要条件是 `m = n`.
即使有 `m = n`, `bm (A B) = bm (B A)` 也未必成立. 令
`bm A = [1,0;0,0]`,
`quad bm B = [0,1;0,0]`,
则 `bm (A B) = bm B`, `bm (B A) = bm O`.
不过, 方阵与数量矩阵 (特别地, 单位阵, 零矩阵) 的乘法可以交换.
两个对角矩阵的乘法可以交换 (事实上, 能与对角矩阵交换的只有对角矩阵).
方阵与自身, 与其伴随矩阵 (第二章), 或者与其逆矩阵 (见下文)
的乘法可以交换.
令 `bm A = (a_(i j))_(m xx n)`, 定义 `bm A` 的转置 `bm A^T (或 bm A') := (t_(i j))_(n xx m)`, 其中 `t_(i j) = a_(j i)`, `quad i in [n], j in [m]`. 矩阵的转置即 "行变列, 列变行". 形象地说, 转置就是将矩阵沿主对角线翻转.
令 `bm A := [ 不,怕,困,难; 挑,战,困,难; 战,胜,困,难; ]`, 则 `bm A^T = [ 不,挑,战; 怕,战,胜; 困,困,困; 难,难,难; ]`.
令 `bm A, bm B` 是 `n` 阶方阵, 如果 `bm (A B) = bm I`, 则称 `bm A` 是 `bm B` 的左逆, `bm B` 是 `bm A` 的右逆. 如果 `bm B` 同时是 `bm A` 的左逆和右逆, 即 `bm (A B) = bm (B A) = bm I`, 则称 `bm B` 是 `bm A` 的逆矩阵. 如果 `bm A` 的逆矩阵存在, 则称它是可逆的. 如果 `bm A` 可逆, 则它的逆矩阵必惟一, 记作 `bm A^-1`.
设 `bm B, bm C` 都是 `bm A` 的逆. 则 `bm B = bm (B I) = bm (B(A C))` `= bm ((B A)C) = bm (I C) = bm C`. 因此逆矩阵必惟一.
利用行列式的知识可以证明,
如果 `bm A` 的左逆存在, 则它也是 `bm A` 的右逆, 反之亦然.
因此只要 `bm (A B) = bm I`, 就可以断言 `bm A, bm B` 都可逆,
且它们互逆.
事实上, 由 `bm (A B) = bm I` 有 `|bm A||bm B| = 1`,
从而 `|bm A| != 0`, 即 `bm A` 可逆. 记 `bm A` 的逆为 `bm A^-1`, 于是
`bm B = bm (I B) = bm (A^-1 A B)`
`= bm (A^-1 I) = bm A^-1`.
每行每列恰有一个元素为 1, 其他元素为 0 的方阵称为置换矩阵, 它表示 `[1..n]` 的一个置换. 置换矩阵是若干个第三类初等矩阵的乘积.
如果 `m xx n` 矩阵 `bm A` 可经有限次初等变换化为 `bm B`, 则称 `bm A, bm B` 等价, 记为 `bm A ~ bm B`. 矩阵的等价是一种等价关系.
`m xx n` 阶矩阵 `bm A, bm B` 等价当且仅当存在 `m` 阶初等矩阵 `{bm P_i}_(i=1)^s` 和 `n` 阶初等矩阵 `{bm Q_j}_(j=1)^t`, 使得 `bm B = bm P_s cdots bm P_2 bm P_1 bm A bm Q_1 bm Q_2 cdots bm Q_t`.
任意 `m xx n` 矩阵等价于如下形状的矩阵 `bm overset ~ A = [bm I_r, bm O; bm O, bm O]_(m xx n)`, 称为 `bm A` 的等价标准形, 其中 `0 le r le min{m,n}`.
任意方阵可分解为一可逆矩阵与一对称矩阵的乘积.
设 `bm A = bm(P overset ~ A Q)`, 其中 `bm P, bm Q` 可逆, `bm overset ~A` 是 `bm A` 的等价标准形, 显然 `bm overset ~ A` 对称. 于是 `bm A = bm (P(Q^T)^-1 Q^T overset ~ A Q)`, 其中 `bm(P(Q^T)^-1)` 可逆, `bm (Q^T overset ~ A Q)` 对称.
设 `bm A = (a_(i j))_(m xx n)`, 则 `bm bar A = (bar a_(i j))_(m
xx n)` 称为 `bm A` 的复共轭矩阵, `bm A^H = bm bar A^T` 称为
`bm A` 的复共轭转置矩阵. 复共轭转置是转置概念的推广.
如果 `bm A in CC^(n xx n)`, `bm A^H = bm A`, 则称 `bm A` 是
Hermite 矩阵 (Hermitian matrix). Hermite
矩阵是对称矩阵概念的推广.
设 `bm A = (a_(i j))_(n xx n)`, 定义 `bm A`
的迹为它的主对角线上的元素之和, 记为
`"tr"bm A := sum_(i=1)^n a_(i i)`.
方阵的迹满足
`"tr"(c bm A) = c "tr"bm A`,
`quad "tr"(bm(A+B)) = "tr"bm A + "tr" bm B`,
`"tr"(bm A^T) = "tr"bm A`.
其中前两条指出, 方阵的迹是线性函数 (第五章).
不论 `bm(A B)`, `bm(B A)` 是否可交换, 它们的迹总是相等
(甚至当它们的尺寸不相等时也是如此):
`"tr"(bm (A B)) = "tr"(bm (B A)) = sum_(i j) a_(i j) b_(j i)`,
特别 `"tr"(bm(A^T A)) = sum_(i j) a_(i j)^2`.
任意 `n` 阶方阵可以写成一个迹为零的矩阵与一个数量矩阵之和:
记 `1/n "tr" bm A = t`.
`bm A = (bm A - t bm I) + t bm I`.
可以验证, `bm A^H bm A` 是 `n` 阶实对称矩阵, 且 `"tr"(bm A^H bm A)` 等于 `bm A` 的每个元素的模的平方和, 即 `"tr"(bm A^H bm A) = sum_(i=1)^m sum_(j=1)^n |a_(i j)|^2`. 从而 `bm A = bm O` 当且仅当 `"tr"(bm A^H bm A) = 0`.
方阵的幂 设 `bm A` 是方阵, `n` 为正整数, 则 `bm A^0 := bm I`, `quad bm A^n := bm (A A)^(n-1)`. 幂运算满足 `bm A^m bm A^n = bm A^(m+n)`, `quad (bm A^m)^n = bm A^(m n)`. 显然 `bm A^m`, `bm A^n` 是可交换的. 当 `bm A, bm B` 可交换时, `bm A^n bm B^n = (bm (A B))^n`.
设 `bm A = (a_(i j))_(n xx n)` 的主对角线的下一条对角线 `i-j = 1`
上的元素全为 1, 其下方元素全为 0, 即
`a_(i j) = {
1, if i-j = 1;
0, if i-j gt 1;
:}`,
`bm A = [
**, cdots, cdots,**;
1,ddots, ,vdots;
, ddots, ddots, vdots;
, , 1, **;
]`
计算可知, 对任意正整数 `k`, `bm A^k = (a_(i j)^((k)))_(n xx n)` 满足
`a_(i j)^((k)) = {
1, if i-j = k;
0, if i-j gt k;
:}`
即每升高一次幂, 全为 1 的那条对角线就下移一个位置. 特别地,
`(delta_(i,j+1))^k = (delta_(i,j+k))`.
方阵的多项式 令 `f(x) = sum_(k=0)^m c_k x^k`, `a_m != 0` 为一多项式, `bm A = (a_(i j))_(n xx n)`, 则 `f(bm A) = sum_(k=0)^n c_k bm A^k` 有意义, 且 `f(bm A) = (f(a_(i j)))_(n xx n)`. 设 `bm A, bm T` 为方阵, `f, g` 为多项式, 且下面的各运算有意义, 则 `f(bm(T^-1 A T)) = bm T^-1 f(bm A) bm T`, `quad f(bm A^T) = f(bm A)^T`, `quad f(bm A)g(bm A) = g(bm A)f(bm A)`. 关于分块上, 下三角矩阵和分块对角矩阵有 `f(bm U_(bm A_k)) = bm U_(f(bm A_k))`, `quad f(bm L_(bm A_k)) = bm L_(f(bm A_k))`, `quad f(bm D_(bm A_k)) = bm D_(f(bm A_k))`.
设 `bm A` 是 `k` 阶单位上三角矩阵, 则 `bm A = bm(I+B)`, 其中 `bm B` 是 `k` 阶严格上三角矩阵. 由于 `bm B^k = bm O`, 有 `bm A^n = bm((I+B))^n` `= bm I + n bm B + (n(n-1))/2 bm B^2 + cdots` `+ (n;k-1) bm B^(k-1)`.
设 `bm A` 是方阵. 由等式 `bm I - bm A^n = bm((I-A)) sum_(k=0)^(n-1) bm A^k` 知道, 若 `bm A^n = bm O` (如, `bm A` 是 `n` 阶严格上三角矩阵), 则 `bm I - bm A` 可逆, `bm((I-A))^-1 = sum_(k=0)^(n-1) bm A^k`.
设 `bm A, bm B` 是 `n` 阶方阵, `bm A, bm B, bm A + bm B` 都可逆, 则 `bm A^-1 + bm B^-1 = bm B^-1(bm B+bm A)bm A^-1` `= bm A^-1(bm B+bm A)bm B^-1`. 容易看出 `bm A^-1 + bm B^-1` 也可逆.
只证 3. 若 `bm(A+B)` 可逆, 则
`bm((A+B))^-1 bm(A B)`
`= bm((A+B))^-1 bm(B A)`
`= bm((A+B))^-1 bm((A+B)) = bm I`.
因此 `bm A`, `bm B` 都可逆.
若 `bm A` 可逆, 则
`bm A^-1(bm A-bm I)bm B`
`= bm A^-1(bm(A B)-bm B)`
`= bm (A^-1 A) = bm I`.
因此 `bm B` 可逆. 从而 `bm(A+B) = bm(A B)` 可逆.
最后若 `bm B` 可逆, 类似可证 `bm A`, `bm(A+B)` 可逆.
设 `bm I + bm(A B)` 可逆, 证明 `bm I + bm(B A)` 也可逆.
设 `bm X = (bm I + bm(A B))^-1`, 则
`bm(B X A)(bm I + bm(B A))`
`= bm(B X)(bm I + bm(A B))bm A`
`= bm(B A)`,
`(bm I + bm(B A))bm(B X A)`
`= bm B(bm I + bm(A B))bm(X A)`
`= bm(B A)`.
故 `bm I - bm(B X A) = (bm I + bm(B A))^-1`.
从形式上计算: `(bm I + bm(B A))^-1` `= bm I + sum_(i=1)^oo bm((-B A))^i` `= bm I - bm B(sum_(i=0)^oo bm((-A B))^i) bm A` `= bm I - bm B(bm I + bm(A B))^-1 bm A`.
设 `bm A = [ 0,1,cdots,1; 1,0,cdots,1; vdots,vdots,,vdots; 1,1,cdots,0; ]_(n xx n)`, 求 `bm A^-1`.
记 `bm B` 是元素全为 `1` 的 `n` 阶矩阵, 则 `bm B^2 = n bm B`.
于是
`(bm B-bm I)(bm B-(n-1)bm I)`
`= bm B^2 - n bm B + (n-1) bm I`
`= (n-1)bm I`,
`bm A^-1 = bm((B-I))^-1 = 1/(n-1) bm B - bm I`.
设 `bm alpha, bm beta` 是 `n` 元列向量,
`bm(alpha^T beta) = bm(beta^T alpha) = c`, 则对任意正整数 `k`,
`bm((alpha beta^T))^k = bm alpha bm((beta^T alpha))^(k-1) bm beta^T`
`= c^(k-1) bm(alpha beta^T)`.
设 `bm I` 是 `n` 阶单位阵, 考虑 `bm I + x bm(alpha beta^T)` 的逆.
计算
`(bm I + x bm(alpha beta^T))(bm I + y bm(alpha beta^T))`
`= bm I + (x+y)bm(alpha beta^T) + c x y bm(alpha beta^T)`.
所以 `bm I + x bm (alpha beta^T)` 可逆当且仅当存在 `y` 使得
`x+y+c x y = 0`, 即 `x = 0` 或 `1+c x != 0`.
此时它的逆就是 `bm I + y bm (alpha beta^T)`.
取 `c = 1`, `x = -1` 可知, `bm I - bm(alpha beta^T)` 不可逆.
事实上 `(bm I - bm (alpha beta^T))^2 = bm I - bm(alpha beta^T)`,
它是幂等矩阵, 但可逆的幂等矩阵只有单位阵, 所以它不可逆.
[来自 ζ(me)=0] 设方阵 `bm A` 满足 `bm A^2 = 2 bm A`, 讨论以下矩阵是否可逆: `bm A-bm I`, `bm A+2bm I`, `bm A - 2bm I`.
如果存在正整数 `k` 使得 `bm A^k = bm O`, 则称 `bm A` 为幂零矩阵 (nilpotent matrix).
`n` 阶矩阵 `bm A` 是幂零矩阵当且仅当它有 `n` 个零特征值.
`rArr`: `bm A^k = bm O` 的特征值是 `bm A` 的特征值的 `k` 次方, 但 `bm O` 的特征值全为零, 所以 `bm A` 的特征值也全为零.
`lArr`: 由 `bm A` 有 `n` 个零特征值知道它的特征多项式是 `x^n`. 因此由 Cayley-Hamilton 定理得到 `bm A^n = bm O`.
[来自群友 SmartPig] 设 `bm A` 为 `n` 阶幂零矩阵, 证明: `bm A != bm O` 时, 它至多有 `n-1` 个线性无关的特征向量.
首先, 幂零矩阵的特征值必为 0. 如果 `bm A` 有 `n` 个线性无关的特征向量, 则它可对角化, 换言之 `bm A` 相似于 `bm O`. 然而 `bm O` 只和自己相似, 这推出 `bm A = bm O`, 矛盾.
若 `bm A^n = bm O`, 则 `bm (I-A)` 可逆, `(bm(I-A))^-1` `= sum_(k=0)^(n-1) bm A^k`.
投影变换的几何解释 投影变换 `cc A` 限制在 `"Im" cc A` 上是恒等映射, 限制在 `"Ker" cc A` 上是零映射. 从矩阵的角度看, 相似标准形 `"diag"(1, cdots, 1, 0, cdots, 0)` 中对角线 1 的部分对应 `cc A` 的像, 0 的部分对应 `cc A` 的核. 可以将 `"Im" cc A` 想象成三维欧氏空间的平面 (投影屏幕), `"Ker" cc A` 是在原点与平面相交的直线 (投影方向). 于是 `cc A` 的作用相当于把空间中的一点沿直线方向投影到平面上. `bb I - cc A` 也是一个投影变换, 它是空间中一点到 `"Ker" cc A` 的投影, 与 `cc A` 正好互补.
只证 1. 先设 `bm((A+B))^2 = bm A + bm B`, 于是
`bm A + bm B`
`= bm A^2 + bm(A B + B A) + bm B^2`
`= bm A + bm(A B + B A) + bm B`.
比较得 `bm(A B) = -bm(B A)`.
于是
`bm(A B) = bm(A A B)`
`= bm(A (-B A)) = -bm((A B)A)`
`= bm(B A A) = bm(B A)`.
但 `bm(A B) = -bm(B A)`, 于是 `bm(A B) = bm(B A) = bm O`.
反面的证明是容易的.
像的等式:
显然 `"Im"(bm(A+B)) = "Im"bm A + "Im"bm B`.
若 `bm(A x) = bm(B y)`, 则 `bm(A x) = bm(A A x)` `= bm (A B y) = bm(O y) = 0`.
因此这是直和.
核的等式: 显然右 `sube` 左. 任取 `bm x in "Ker"(bm(A+B))`, 则
`bm (A x)`
`= bm (A x) - (bm(A+B)) bm x`
`= bm (A^2 x) - (bm(A+B))^2 bm x`
`= -bm (B^2) bm x`
`= bm B (-bm x)`.
等式左端 `in "Im" bm A`, 右端 `in "Im" bm B`, 因此它们都等于 `0`, 即 `bm x in "Ker"bm A nn "Ker" bm B`.
[来自群友 SmartPig] 对 `n` 阶矩阵 `bm A, bm B` 有 `"Ker"bm A = "Ker"bm B` `iff bm(A B) = bm A`, `bm(B A) = bm B`.
[来自群友 SmartPig]
`n` 阶矩阵 `bm A, bm B` 满足
`"rank"(bm A + bm B) = "rank"bm A + "rank"bm B`,
`(bm A + bm B)^2 = bm A + bm B`.
证明 `bm A^2 = bm A`, `bm B^2 = bm B`.
[来自群友 TrivialPig]
首先 `"Im"(bm(A+B)) le "Im"bm A + "Im"bm B`, 又由已知
`"dim Im"(bm(A+B)) = "dim Im"bm A + "dim Im"bm B`,
这推出 `"Im"(bm(A+B)) = "Im"bm A o+ "Im"bm B`.
取 `"Im"bm A` 和 `"Im"bm B` 的基底, 则两个基底合起来组成了 `"Im"(bm(A+B))`
的基底. 在这组基底下, `bm A, bm B` 分别相似于
`[bm A_1; bm O]`,
`quad [bm O; bm B_1]`.
但由于 `bm(A+B)` 是幂等矩阵, 它限制在 `"Im"(bm(A+B))` 上是恒等变换, 这推出两个矩阵之和
`[bm A_1; bm O]`
`+ [bm O; bm B_1]`
`= [bm A_1; bm B_1]`
`= bm I`.
于是 `bm A` 相似于 `"diag"(1, cdots, 1, 0, cdots, 0)`, `bm B` 相似于
`"diag"(0, cdots, 0, 1, cdots, 1)`, 正说明它们是幂等矩阵.
[来自群友 澄]
与前一种证法相同, 推出 `"Im"(bm(A+B)) = "Im"bm A o+ "Im"bm B`.
接下来, 由已知
`bm A(bm(A+B)) + bm B(bm(A+B)) = bm(A+B)`,
因此由直和分解得到
`bm A(bm(A+B)) = bm A`,
`bm B(bm(A+B)) = bm B`.
由直和分解还能进一步得到: 对任意 `bm x, bm y in V`, 存在 `bm z in V` 使得
`bm(A x) + bm(B y) = (bm(A+B)) bm z`,
且 `bm(A x) = bm(A z)`, `bm(B y) = bm(B z)`.
左乘 `bm A` 得到
`bm A^2 bm x + bm(A B y)`
`= bm A(bm(A+B)) bm z`
`= bm(A z)`
`= bm(A x)`.
特别取 `bm y = 0` 有 `bm A^2 bm x = bm (A x)`, 即 `bm A^2 = bm A`.
对合矩阵 是指满足 `bm A^2 = bm I` 的方阵. 例如, 副对角线上全为 1, 其他全为 0 的矩阵是对合矩阵, 它代表 `[1..n]` 的倒序排列. 对合矩阵的逆就是自己. 对合矩阵的特征值只能取 `+-1`.
或许, 对合矩阵是矩阵家族中的「二次元」.
[来自群友 问情明心] 设 `n` 阶复矩阵 `bm X` 满足 `bm X^m = bm I_n`, 求 `bm X`.
`bm X` 有零化多项式 `x^m - 1`. 因此它的最小多项式是 `x^m - 1` 的因式, 从而是无重根的. 根据矩阵可对角化的等价条件, `bm X` 可以对角化, 且相似于 `"diag"(x_1, cdots, x_n)`, 其中每个对角元素都是 `m` 次单位根, 即 `x_i^m = 1`, `i = 1, cdots, n`.
设 `bm A in bbb F^(n xx n)`, `"char" bbb F != 2`, 则 `bm A` 反对称 `iff AA bm x in bbb F^n`, `bm x^(sf T) bm (A x) = 0`.