数论算法

基础

n 次方根取整 求 `|__ root n a __|`, 其中整数 `a ge 0`, `n ge 2`. 使用牛顿迭代法 `x = ((n-1)x + a//x^(n-1))//n`, 其中除法均向下取整.

说明: `235^2 = 55225`, `236^2 = 55696`, 因此 `|__ sqrt 55555 __| = 235`

快速幂 (反复平方法) 求 `a^n`, 先将指数 `n` 写为二进制: `n = (n_k cdots n_1 n_0)_2` `= sum_(i=0)^k n_i 2^i`, 于是 `a^n = prod_("where "n_i = 1) a^(2^i)`.

在算法每次迭代的开头, 变量 `a = 5, 5^2, 5^4, 5^8`, 对应到 `14` 的二进制表示 `0*1 + 1*2 + 1*4 + 1*8` 中系数为 `1` 的项, 结果为 `5^14 = 5^2 * 5^4 * 5^8`.

辗转相除法 设 a, b 为正整数, 求最大公约数 d, 同时求出系数 x, y 满足 a x + b y = d.

75 = (1, 0)
32 = (0, 1)
11 = (1, -2)
10 = (-2, 5)
1 = (3, -7)

gcd 倍乘优化 已知正整数 `n`, 求最大的正整数 `m | n`, 且 `m` 无平方因子, 即不存在素数 `p` 使得 `p^2 | m`.

为避免对 `n` 作因子分解, 可以求出 `2` 到 `sqrt n` 间所有素数的乘积 `M`, 然后 `m = gcd(M, n)`. 这里 `M` 是一个很大的数; 如果 `n` 的范围已知, 可以通过查表得到 `M`. 如果 `M` 过大, 可以考虑每三个素数乘积求一次 gcd, 再将结果相乘, 即 `m = gcd(2*3*5, n) * gcd(7*11*13, n) * cdots`

同余

求模 `n` 乘法逆元 若 `a x -= 1 (mod n)`, 则称 `x` 为 `a` 模 `n` 的乘法逆元.
若 `(a, n) = 1`, 则存在 `x, y` 使得 `a x + n y = 1`, 即 `a x -= 1 (mod n)`. 因此应用 gcdExtended 就可获得乘法逆.

线性求逆 求 `1` 到 `p-1` 的各整数模素数 `p` 的乘法逆元.
设 `0 lt a lt p`, `x = p mod a`, `y = |__p // a__|`. 则 `0 lt x lt p`, 说明 `x` 模 `p` 有逆元. 计算知 `x + y a = p -= 0 (mod p)`, `x -= -y a (mod p)`, `x a^-1 -= -y (mod p)`, `a^-1 = x^-1 (p-y) (mod p)`.

前缀积求逆 求整数 `a_1, cdots, a_n` 模素数 `p` 的乘法逆元, 其中每个整数都与 `p` 互素. 这是求逆元的一种离线算法. 记第 `i` 个前缀积为 `"pre"_i -= prod_(j=1)^i a_j (mod p)`. 注意若 `(a, p) = (b, p) = 1`, 则 `a^-1 b^-1 -= (a b)^-1 (mod p)`. 于是前缀积的逆等于逆的前缀积, 即 `"pre"_i^-1 -= prod_(j=1)^i a_j^-1 (mod p)`. 利用这一性质设计算法如下: 先使用 gcdExtended 计算所有数的乘积模 `p` 的逆元 `"pre"_n^-1`, 然后递推 `a_i^-1 -= "pre"_i^-1 * "pre"_(i-1) (mod p)`,
`"pre"_(i-1)^-1 -= "pre"_i^-1 * a_i (mod p)`. 时间复杂度为 `O(n + log p)`.

求模 `p` 的平方根, `p -= 3(mod 4)` 设 `p` 是模 4 余 3 的素数, `n` 为模 `p` 的二次剩余, 记 `s = (p-1)/2`, 由 Legendre 符号知道 `n^s -= 1 (mod p)`. 这里 `s` 是奇数, 容易验证 `+-n^((s+1)//2)` 就是 `n` 模 `p` 的平方根.

对于模 4 余 1 的素数, 我们有如下算法:

Cipolla 算法: 求模 `p` 的平方根

来自 olderciyuan

取合适的 `a in bbb F_p`, 使得 `a^2 - n` 是二次非剩余. 由于模 `p` 的二次非剩余恰有一半, 我们只要随机选取, 然后用 Euler 判别法, 若 `(a^2-n)^((p-1)//2) = -1`, 即可判断它是二次非剩余.
将 `a^2-n` 的一个平方根 `i = sqrt(a^2 - n)` 加到 `bbb F_p` 中, 得到扩域 `bbb F_p(i)`. 这个域的特征为 `p`, 其中的元素形如 `A + Bi`, `A, B in bbb F_p`.
可以证明 `(a+i)^(p+1) = n`, 因此 `n` 在扩域 `bbb F_p(i)` 中有一对平方根 `+-(a+i)^((p+1)//2)`. 事实上, 这对平方根属于 `bbb F_p`, 因此它们就是 `n` 模 `p` 的平方根.
上述过程中应用快速幂算法, 总的时间复杂度为 `O(log p)`.

先证 `i^p = -i`. 事实上 `i * i^(p-1)` `= i * (a^2-n)^((p-1)//2)` `= -i`. 最后一个等式成立是因为 `a^2-n` 为二次非剩余.
Fermat 小定理: `AA a in bbb F_p`, `a^p = a`.
由于 `bbb F_p(i)` 的特征为 `p`, 故 `AA a, b in bbb F_p(i)` 有 `(a+b)^p = a^p + b^p`.
现在可以算出: `(a+i)^(p+1)` `= (a+i)(a+i)^p` `= (a+i)(a^p+i^p)` `= (a+i)(a-i)` `= a^2-i^2` `= n`.
下证 `n` 的平方根必定属于 `bbb F_p`. 设 `(A+B i)^2 = n`, 即 `A^2 + B i^2 + 2A B i = n`. 比较两边虚部得 `A B = 0`, 因此 `A = 0` 或 `B = 0`.
若 `A = 0`, 有 `B^2 i^2 = n`, 但 `B^2, n` 均为二次剩余, `i^2` 为二次非剩余, 矛盾. 故 `B = 0`, 即 `A + B i in bbb F_p`.

说明: `5^2 -= 8 (mod 17)`, 因此 8 模 17 的平方根为 `+-5`. 我们只显示其中一个根 (最小正根).

用 sympy 求模 `p` 的平方根: sympy.ntheory.residue_ntheory.sqrt_mod(a, p, all_roots=False)

中国剩余定理 给定两两互素的正整数 `n_1, cdots, n_k` 和任意 `k` 个整数 `a_1, cdots, a_k`, 则线性同余方程组 `{ x -= a_1 (mod n_1); cdots; x -= a_k (mod n_k); :}` 在模 `N` 的意义下存在唯一解 `x`. 这里 `N = n_1 * cdots * n_k`.
事实上, 记 `M_i = prod_(j != i) n_j`, 又记 `M_i^-1` 是 `M_i` 模 `n_i` 的逆, 则 `x -= sum_(i=1)^k a_i * M_i^-1 * M_i (mod N)`. 验证: 上式两边模 `n_i`, 由于除了 `M_i` 这一项外, 各项都是 `n_i` 的倍数, 我们得到 `x -= a_i * M_i^-1 * M_i -= a_i (mod n_i)`.

说明: `x -= 2 (mod 5), x -= 3 (mod 11), x -= 5 (mod 17)` 的解为 `x -= 872 (mod 935)`.

素性测试

试除法判断素数 时间复杂度 `O(sqrt n)`.

143 = 11 * 13 不是素数

Fermat 小定理: 若 `n` 是素数, 则对任意与 `n` 互素的 `a` 都有 `a^(n-1) -= 1(mod n)`. 满足 Fermat 小定理的合数叫做 Carmichael 数, 最小的 Carmichael 数是 561 = 3 * 11 * 17.
二次探测定理: 若 `p` 是奇素数, 则 `1` 模 `p` 的平方根只有 `+-1 (mod p)`.

Miller Rabin 素性检测 结合了 Fermat 测试与二次探测. 设待检测整数为 `n`, 令 `n-1 = 2^t u`, 其中 `u` 是奇数. 随机选取 `a = 2, ..., n-2`, 并计算 `a^u (mod n)`. 如果已经有 `a^u -= 1 (mod n)`, 则通过本轮素性检测. 否则, 从 `a^u` 到 `a^(n-1)` 尚需要 `t` 次平方操作. 在这过程中, 若存在某个 `s` 使得 `a^(2^s u) -= -1 (mod n)`, 则通过本轮素性检测; 如果 `1` 模 `n` 存在非平凡的平方根 `(!= +-1)`, 那么就找不到符合上式的 `s`, 算法输出 false. 如果整数 `n` 连续通过多轮 `(ge 8)` 素性检测, 可以认为它大概率是素数.

因数分解

遍历所有因数 时间复杂度 `O(sqrt n)`

30 的所有因数为 1, 2, 3, 5, 6, 10, 15, 30

因数分解 (暴力算法) 设 n 是正整数, 返回 n 的所有素因子及其次数. 最坏情况下 n 是素数, 时间复杂度 `O(sqrt n)`.

252 = 2^2 * 3^2 * 7

linux 系统可以用 factor 命令分解整数. sympy 可以用 factorint.

Pollard ρ 因数分解, 1975 [来自《算法导论》、OI Wiki]
此算法寻找正整数 `n` 的非平凡因子 (不一定是素因子). 首先选取种子 `x_0`, 按如下格式迭代生成数列 `{x_k}`: `x_(k+1) = x_k^2 + c (mod n)` 其中 `1 le c lt n` 是随机选取的整数设 `p` 是 `n` 的最小素因子, 根据鸽巢原理, 至多 `p` 项以后数列模 `p` 的余数必出现循环. 此时数列可以看作一个与自身相交的链表, 形如希腊字母 ρ.
为了检测到这个循环, 我们采取双指针策略: 初始时让两指针的间隔为 1, 每次前面的指针前进 2 项, 后面的指针前进 1 项, 使它们间隔逐渐拉大. 当指针间隔等于循环长度时, 必有 `x_i = x_j (mod p)`. 这时我们检查 `d = gcd(x_i - x_j, n)`, 若 `1 lt d lt n`, 那么它就是 `n` 的一个非平凡因子. 注意: 该算法有时会失败, 因为 `d` 可能等于 `n`.
算法的时间复杂度等于循环长度的期望值 `O(sqrt p)` (参见生日问题), 乘以 gcd 花费的时间 `O(log n)` 由于 `n` 是合数时, `p` 不超过 `sqrt n`, 所以时间复杂度也可以是 `O(n^(1//4) log n)`.

65537 -> prime
9379 -> 83 或 113

筛法

Eratosthenes 筛法 求 n 以内的所有素数. 注意到素数的倍数一定是合数, 算法先将 bool 数组 flag 初始化为 false, 一旦发现 j 是合数, 就令 flag[j] = true. 时间复杂度为 `O(n log log n)`.

100 以内的素数为 2,3,5,7,11,13,17,19,23,29,31,37,41,43,47,53,59,61,67,71,73,79,83,89,97.

n	`pi(10^n) = 10^n` 以内的素数个数
7	664,579
8	5,761,455
9	50,847,534

Euler 线性筛 求 N 以内素数的一种线性时间的算法. 在 Eratosthenes 算法中, 一个合数可能被反复判断: 如 12 被 2*6 排除, 也被 3*4 排除. 现在规定每个合数都被自己的最小素因子排除, 从而 12 只能由 2 来排除, 等等. 由于每个合数只被排除一次, 所以时间复杂度为 `O(N)`.
算法使用两重循环, 分别枚举 ≥2 的整数 i 和素数 p, 然后将合数 k = i * p 排除掉. 一方面, 每个合数都能写为 `k = i p` 的形式, 因此总会被排除; 另一方面, 通过跳出循环, 保证每个合数都只被自己的最小素因子排除一次.
算法使用的数组 flag[N+1] 同上. 另有数组 primes[M] 用于保存已经得到的素数. 可以参考上表确定合适的 M 值, 如 N = 1e9 时可取 M = 50847534.

被排除的合数:
2*2
2*3 3*3
2*4
2*5 3*5 5*5
2*6
2*7 3*7 5*7 7*7

其它

计算某年月日是星期几 (Zeller 公式) 先把月份数减 2, 其中 1、2 月分别映射为前一年的 11、12 月. 处理后的世纪、年、月、日分别记为 `c, y, m, d`, 则计算星期几的公式为 `w -= |__5.25c__| + |__1.25y__| + |__2.6m-0.2__| + d quad (mod 7)`. 结果 0-6 分别表示星期日到星期六. 对于 21 世纪 (2000 年 3 月至 2100 年 2 月) 而言, 和 `c` 有关的第一项正好为零. 实际计算时, 把公式中的小数化为分数, 比如 `|__1.25y__| = y + |__y/4__|`, `quad |__2.6m - 0.2__| = 2m + |__(3m-1)/5__|`.

说明: 2025 年 3 月 18 日是星期二.