合同标准形

实二次型 是指实数域上的 `n` 元二次齐次多项式 `f(x_1, cdots, x_n) = sum_(i, j) a_(i j) x_i x_j`, 其中 `a_(i j) in RR`. 由于 `x_i x_j = x_j x_i`, 可以规定其系数满足 `a_(i j) = a_(j i)`, 于是实二次型 `f` 唯一对应于实对称矩阵 `bm A = (a_(i j))_(n xx n)`, 满足 `f(bm X) = bm (X^T A X)`, `quad bm X = (x_1, cdots, x_n)^T`. 矩阵 `bm A` 就称为 `f` 的矩阵.

在可逆线性变换 `bm X = bm (P Y)` 下, 实二次型 `bm (X^T A X)` 变为 `bm (Y^T P^T A P Y)`, 其矩阵变为 `bm(P^T A P)`, 即可逆线性变换下实二次型的矩阵保持合同. 下面证明, 存在这样的可逆线性变换, 使得实二次型变为平方和的形式 (标准形), 换言之, 使实对称矩阵合同于对角形矩阵. 实二次型化为平方和的计算过程称为它的标准化. 注意其标准形一般不唯一.

实对称矩阵的正交对角化

任意实对称矩阵可以正交对角化: `bm A = bm (T Lambda T)^-1`, 其中 `bm T` 为正交矩阵, `bm Lambda` 为对角矩阵. 参见第六章.

实二次型的标准化 (配方法)

本节的配方法给出另一种将实对称矩阵合同对角化的方法. 相比于正交对角化, 它的计算量更小.

实二次型的标准化 (配方法) 存在可逆线性变换 `bm X = bm (P Y)`, 使得实二次型化为平方和的形式.

    对变量个数 `n` 作归纳. `n = 1` 时, `f(x_1) = a_11 x_1^2` 已经是平方和. 设结论对 `n-1` 成立, 则
  1. 若存在某个平方项系数不为零, 不妨设 `a_11 != 0`, 有 `f = a_11 x_1^2 + 2 sum_(j=2)^n a_(1 j) x_1 x_j` `+ sum_(i,j=2)^n a_(i, j) x_i x_j`. `y_1 = x_1 + sum_(j=2)^n a_(1 j) a_11^-1 x_j`,
    `y_2 = x_2`, `cdots`, `y_n = x_n`,
    `f = a_11 y_1^2 + sum_(i,j=2)^n (a_(i j) - a_(1 i) a_(1 j) a_11^-2) x_i x_j` `= a_11 y_1^2 + sum_(i,j=2)^n b_(i j) y_i y_j`. 由归纳假设, 上式第二项可以配为平方和.
  2. 若所有平方项系数均为零, 则任取一个交叉项系数, 不妨设 `a_(1 2) != 0`. 令 `x_1 = y_1 - y_2`, `x_2 = y_1 + y_2`,
    `x_3 = y_3`, `cdots`, `x_n = y_n`,
    `f = a_12 x_1 x_2 + sum_(i,j=3)^n a_(i j) x_i x_j` `= a_12 (y_1^2 - y_2^2) + sum_(i,j=3)^n a_(i j) y_i y_j`, 同样由归纳假设, 上式第二项可以配为平方和.
    矩阵语言的证明. 事实上, 上述可逆矩阵 `bm P` 可以分解为一系列初等矩阵的乘积. 这里给出配方法的矩阵表述. `n = 1` 时取 `bm P` 为单位矩阵即可. 假设对 `n-1` 阶实对称矩阵 `bm A_(n-1)`, 存在初等矩阵 `bm P_i`, `i = 1, cdots, n-1` 使得 `bm(P^T A_(n-1) P)` 为对角阵, `bm P = prod_(i=1)^(n-1) bm P_i`, 则对 `n` 阶实对称矩阵 `bm A_n`, 有
  1. 若 `a_11 != 0`, 将第一列的 `-a_(1 j) a_11^-1` 倍加到第 `j` 列, `j = 2, cdots, n`; 对称地, 将第一行的 `-a_(i 1) a_11^-1` 倍加到第 `i` 行, `i = 2, cdots, n`. 由于 `bm A_n` 为实对称矩阵, 上述初等变换将它化为 `[a_11, 0; 0, bm A_(n-1)]`. 对子矩阵 `bm A_(n-1)` 应用归纳假设即得结论.
  2. 若 `bm A_n` 的对角元全为零, 但 `a_(i j) != 0`, 则将第 `j` 列加到第 `i` 列, 再将第 `j` 行加到第 `i` 行. 变换后的 `a_(i i) = 2 a_(i j) != 0`, 于是问题化为 1. 的情况, 证毕.
  3. 上述证明中, 每施行一个列初等变换, 就立即施行一个相同的行初等变换. 这样操作得到的矩阵始终合同于原矩阵, 称为合同初等变换.

惯性定理与实二次型的分类

虽然实对称矩阵的标准形不唯一, 但其对角线上的正数与负数的数目是不变的, 这就是下面的定理:

实对称矩阵的规范形 (惯性定理) 任意实对称矩阵 `bm A` 合同于如下的规范形: `bm(P^T A P) = "diag"( overset p overbrace(1, cdots, 1), overset q overbrace(-1, cdots, -1), 0, cdots, 0 )`, 其中 `bm P` 为可逆矩阵. `p` 为正惯性指数, `q` 为负惯性指数, `p + q = "rank"(bm A)`. 且 `p`, `q` 的值由 `bm A` 唯一确定, 与 `bm P` 的选择无关.

    事实上, 设 `bm A` 合同于对角阵 `bm D`, 分两步将它调整为规范形:
  1. 通过合同初等变换调整对角元的次序: 先交换 `i, j` 两列, 再交换 `i, j` 两行, 效果相当于交换了 `d_(i i)` 和 `d_(j j)`.
  2. 对每个非零对角元 `d_(i i)`, 先让第 `i` 列同乘 `|d_(i i)|^(-1//2)`, 再让第 `i` 行同乘 `|d_(i i)|^(1//2)`, 效果是将正的对角元化为 `1`, 负的化为 `-1`.
  3. `"rank"(bm A) = p + q` 不随初等变换而改变, 因此它是合同变换下的不变量 (相合不变量). 下证 `p`, `q` 也分别是相合不变量. 反设存在两种不同的可逆线性变换 `bm Y = bm(P X)` 和 `bm Z = bm(Q X)` 将二次型化为规范形, 设前者的正、负惯性指数为 `r, s`, 后者为 `p, q`, 其中 `r+s = p+q = "rank"(bm A)`. 若 `r lt p`, 记 `bm P = (p_(i j))`, `bm Q = (q_(i j))`. 考虑线性方程组 `y_1 = cdots = y_r = 0`, `z_(p+1) = cdots = z_n = 0`, `[p_11, cdots, p_(1 n); vdots, , vdots; p_(r 1), cdots, p_(r n); q_(p+1, 1), cdots, q_(p+1, n); vdots, , vdots; q_(n 1), cdots, q_(n n)] [x_1; vdots; x_r; x_(p+1); vdots; x_n] = bb 0`. 由于方程的数目小于变元的数目, 上述线性方程组有非零解 `bm X^**`, 其对应的 `y_1^** = cdots = y_r^** = 0`, `z_(p+1)^** = cdots = z_n^** = 0`, 由 `bm X^** != bb 0` 且 `bm P`, `bm Q` 可逆知道, `y_(r+1)^**, cdots, y_(r+s)^**` 不全为零, `z_1^**, cdots, z_p^**` 也不全为零. 于是 `bm (X^T A X) = -sum_(i=1)^s y_(r+i)^**{::}^2 lt 0`, 同时 `bm (X^T A X) = sum_(i=1)^p z_i^**{::}^2 gt 0`, 得到矛盾.

实二次型的分类 两个实二次型等价 (两个实对称矩阵合同) 当且仅当它们的秩相等, 且正惯性指数相等.

二次曲线的分类 [参看二元二次方程及其表示的曲线]

正定

    设 `bm A` 为 `n` 阶实对称矩阵,
  1. 若 `bm A` 的正惯性指数 `p = n`, 则称 `bm A` 正定;
  2. 若 `bm A` 的负惯性指数 `q = n`, 则称 `bm A` 负定.
  3. 由定义知正定矩阵合同于单位矩阵, 即存在可逆矩阵 `bm P` 使得 `bm A = bm(P^T P)`,

以后我们说“正定矩阵”, 总假定它是实对称矩阵.

正定矩阵的行列式 `|bm A| = |bm(P^T P)| = |bm P|^2 gt 0`.

实对称矩阵 `bm A` 正定当且仅当二次型 `bm(x^T A x)` 正定, 即 `bm(x^T A x) ge 0`, 等号成立当且仅当 `bm x = bb 0`.

设 `bm A = bm(P^T P)`, 则 `bm(x^T A x) = bm(x^T P^T P x) = (bm(P x), bm(P x)) ge 0`, 等号成立当且仅当 `bm(P x) = bb 0`, 即 `bm x = bb 0`.
另一方面, 若 `bm A` 的合同标准形为 `bm(P^T A P) = "diag"(a_1, cdots, a_n)`, 取 `bm y = (0, cdots, 0, 1, 0, cdots, 0)^T`, `bm x = bm(P y)`, 则 `bm(x^T A x) = bm(y^T P^T A P y) = a_i gt 0`. 这说明 `bm A` 的合同标准形中主对角线全为正, 即 `bm A` 正定.

正定的几何解释: 若向量 `bm x != bb 0` 且 `bm A` 正定, 则 `(bm (A x), bm x) = bm(x^T A x) gt 0`, 即变换后的向量 `bm(A x)` 与原向量 `bm x` 的夹角恒为锐角. 类似地, 负定矩阵变换前后的向量夹角恒为一钝角.

正定矩阵 `bm A` 的主子阵也是正定矩阵. 即, 由第 `i_1, cdots, i_k` 行和第 `i_1, cdots, i_k` 列相交的子阵是正定矩阵.

取 `bm A` 前 `k` 行前 `k` 列组成的子阵 `bm A_k`, 则二次型 `bm(x^T bm A_k x) = (x_1, cdots, x_k, 0, cdots, 0) bm A (x_1, cdots, x_k, 0, cdots, 0) ge 0` 也正定. 但正定二次型与变元次序无关, 因此 `bm A` 的任意 `k` 阶主子式都正定.

实对称矩阵 `bm A` 正定当且仅当它的特征值全为正.

设 `bm(A x) = lambda bm x`, `bm x != bb 0`, 则 `lambda bm(x^T x) = bm(x^T A x) gt 0`, 由 `bm(x^T x) gt 0` 知 `lambda gt 0`.
反之, `bm A` 正交相似于对角矩阵: `bm (T^T A T) = "diag"(lambda_1, cdots, lambda_n)`, 其中 `lambda_i gt 0`, `i = 1, cdots, n`, 这说明 `bm A` 正定.

实对称矩阵 `bm A` 正定当且仅当 `bm A` 的顺序主子式全为正. 顺序主子式是 `bm A` 的前 `k` 行前 `k` 列组成的行列式.

`bm A` 的前 `k` 行前 `k` 列组成的子阵记为 `bm A_k`. 若 `bm A` 正定, 则它的 `k` 阶主子阵 `bm A_k` 正定, 因而 `|bm A_k| gt 0`.
现在设 `bm A` 的顺序主子式全为正, 要证 `bm A` 正定. 对 `bm A` 的阶数 `n` 归纳: `n = 1` 时显然成立. 设结论对 `n-1` 成立, 要证 `bm A = [bm A_(n-1), bm C; bm C^T , a_(n n)]` 正定, 我们对它进行合同初等变换, 将它化为对角形:
首先第一行左乘 `-bm (C^T A_(n-1)^-1)` 加到第二行, 第一列右乘 `-bm(A_(n-1)^-1 C)` 加到第二列得: `bm A^((1)) = [bm A_(n-1), bb 0; bb 0, a_(n n) - bm(C^T A_(n-1)^-1 C)]`. 由归纳假设和 `bm A_(n-1)` 的顺序主子式全为正知 `bm A_(n-1)` 正定, 记 `bm(P^T A_(n-1) P) = bm I_(n-1)`. 于是上式第一行左乘 `bm P^T`, 第一列右乘 `bm P` 得 `bm A^((2)) = [bm I_(n-1), bb 0; bb 0, a]`, 其中 `a = a_(n n) - bm(C^T A_(n-1)^-1 C)`.
由于合同变换不改变行列式的符号 (例如 `|bm(P^T A P)| = |bm P|^2 |bm A|`), 而 `|bm A| gt 0`, 所以 `a = |bm A^((2))| gt 0`.
最后上式第二行左乘 `1/sqrt a`, 第二列右乘 `1/sqrt a`, 就得到 `bm A^((3)) = bm I_n`. 故 `bm A` 正定.

综上, 对于实对称矩阵 `bm A`, 我们有 `bm A` 正定 `iff bm A = bm(P^T P)` `iff bm(x^T A x)` 正定 `iff bm A` 顺序主子式全为正 `iff bm A` 的特征值全为正.

    [来自 ζ(me)=0] 设 `bm A, bm B` 是实正定矩阵, 则
  1. `bm (AB)` 正定当且仅当 `bm(AB) = bm(BA)`;
  2. 若 `bm A-bm B` 正定则 `bm B^-1 - bm A^-1` 也正定;
  1. ??