2.3 递归

1) 概述

定义

计算机科学中,递归是一种解决计算问题的方法,其中解决方案取决于同一类问题的更小子集

In computer science, recursion is a method of solving a computational problem where the solution depends on solutions to smaller instances of the same problem.

比如单链表递归遍历的例子:

1
2
3
4
5
6
7
8
void f(Node node) {
if(node == null) {
return;
}
println("before:" + node.value)
f(node.next);
println("after:" + node.value)
}

说明:

  1. 自己调用自己,如果说每个函数对应着一种解决方案,自己调用自己意味着解决方案是一样的(有规律的)
  2. 每次调用,函数处理的数据会较上次缩减(子集),而且最后会缩减至无需继续递归
  3. 内层函数调用(子集处理)完成,外层函数才能算调用完成

原理

假设链表中有 3 个节点,value 分别为 1,2,3,以上代码的执行流程就类似于下面的伪码

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
// 1 -> 2 -> 3 -> null  f(1)

void f(Node node = 1) {
println("before:" + node.value) // 1
void f(Node node = 2) {
println("before:" + node.value) // 2
void f(Node node = 3) {
println("before:" + node.value) // 3
void f(Node node = null) {
if(node == null) {
return;
}
}
println("after:" + node.value) // 3
}
println("after:" + node.value) // 2
}
println("after:" + node.value) // 1
}

思路

  1. 确定能否使用递归求解
  2. 推导出递推关系,即父问题与子问题的关系,以及递归的结束条件

例如之前遍历链表的递推关系为
$$
f(n) =
\begin{cases}
停止& n = null \
f(n.next) & n \neq null
\end{cases}
$$

  • 深入到最里层叫做
  • 从最里层出来叫做
  • 的过程中,外层函数内的局部变量(以及方法参数)并未消失,的时候还可以用到

2) 单路递归 Single Recursion

E01. 阶乘

用递归方法求阶乘

  • 阶乘的定义 𝑛!=1⋅2⋅3⋯(𝑛−2)⋅(𝑛−1)⋅𝑛,其中 𝑛 为自然数,当然 0!=1
  • 递推关系

$$
f(n) = \begin{cases}1 & n = 1\n * f(n-1) & n > 1\end{cases}
$$

代码

1
2
3
4
5
6
private static int f(int n) {
if (n == 1) {
return 1;
}
return n * f(n - 1);
}

拆解伪码如下,假设 n 初始值为 3

1
2
3
4
5
6
7
8
9
f(int n = 3) { // 解决不了,递
return 3 * f(int n = 2) { // 解决不了,继续递
return 2 * f(int n = 1) {
if (n == 1) { // 可以解决, 开始归
return 1;
}
}
}
}

E02. 反向打印字符串

用递归反向打印字符串,n 为字符在整个字符串 str 中的索引位置

  • :n 从 0 开始,每次 n + 1,一直递到 n == str.length() - 1
  • :从 n == str.length() 开始归,从归打印,自然是逆序的

递推关系

$$
f(n) = \begin{cases}停止 & n = str.length() \f(n+1) & 0 \leq n \leq str.length() - 1\end{cases}
$$
代码为

1
2
3
4
5
6
7
public static void reversePrint(String str, int index) {
if (index == str.length()) {
return;
}
reversePrint(str, index + 1);
System.out.println(str.charAt(index));
}

拆解伪码如下,假设字符串为 “abc”

1
2
3
4
5
6
7
8
9
10
11
12
13
14
void reversePrint(String str, int index = 0) {
void reversePrint(String str, int index = 1) {
void reversePrint(String str, int index = 2) {
void reversePrint(String str, int index = 3) {
if (index == str.length()) {
return; // 开始归
}
}
System.out.println(str.charAt(index)); // 打印 c
}
System.out.println(str.charAt(index)); // 打印 b
}
System.out.println(str.charAt(index)); // 打印 a
}

E03. 二分查找(单路递归)

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
public static int binarySearch(int[] a, int target) {
return recursion(a, target, 0, a.length - 1);
}

public static int recursion(int[] a, int target, int i, int j) {
if (i > j) {
return -1;
}
int m = (i + j) >>> 1;
if (target < a[m]) {
return recursion(a, target, i, m - 1);
} else if (a[m] < target) {
return recursion(a, target, m + 1, j);
} else {
return m;
}
}

E04. 冒泡排序(单路递归)

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
public static void main(String[] args) {
int[] a = {3, 2, 6, 1, 5, 4, 7};
bubble(a, 0, a.length - 1);
System.out.println(Arrays.toString(a));
}

private static void bubble(int[] a, int low, int high) {
if(low == high) {
return;
}
int j = low;
for (int i = low; i < high; i++) {
if (a[i] > a[i + 1]) {
swap(a, i, i + 1);
j = i;
}
}
bubble(a, low, j);
}

private static void swap(int[] a, int i, int j) {
int t = a[i];
a[i] = a[j];
a[j] = t;
}
  • low 与 high 为未排序范围
  • j 表示的是未排序的边界,下一次递归时的 high
    • 发生交换,意味着有无序情况
    • 最后一次交换(以后没有无序)时,左侧 i 仍是无序,右侧 i+1 已然有序
  • 视频中讲解的是只考虑 high 边界的情况,参考以上代码,理解在 low … high 范围内的处理方法

E05. 插入排序(单路递归)

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
public static void main(String[] args) {
int[] a = {3, 2, 6, 1, 5, 7, 4};
insertion(a, 1, a.length - 1);
System.out.println(Arrays.toString(a));
}

private static void insertion(int[] a, int low, int high) {
if (low > high) {
return;
}
int i = low - 1;
int t = a[low];
while (i >= 0 && a[i] > i) {
a[i + 1] = a[i];
i--;
}
if(i + 1 != low) {
a[i + 1] = t;
}
insertion(a, low + 1, high);
}
  • 已排序区域:[0 … i … low-1]
  • 未排序区域:[low … high]
  • 视频中讲解的是只考虑 low 边界的情况,参考以上代码,理解 low-1 … high 范围内的处理方法
  • 扩展:利用二分查找 leftmost 版本,改进寻找插入位置的代码

E06. 约瑟夫问题[^16](单路递归)

𝑛 个人排成圆圈,从头开始报数,每次数到第 𝑚 个人(𝑚 从 1 开始)杀之,继续从下一个人重复以上过程,求最后活下来的人是谁?

方法1

根据最后的存活者 a 倒推出它在上一轮的索引号

f(n,m) 本轮索引 为了让 a 是这个索引,上一轮应当这样排 规律
f(1,3) 0 x x x a (0 + 3) % 2
f(2,3) 1 x x x 0 a (1 + 3) % 3
f(3,3) 1 x x x 0 a (1 + 3) % 4
f(4,3) 0 x x x a (0 + 3) % 5
f(5,3) 3 x x x 0 1 2 a (3 + 3) % 6
f(6,3) 0 x x x a

方法2

设 n 为总人数,m 为报数次数,解返回的是这些人的索引,从0开始

f(n, m) 规律
f(1, 3) 0
f(2, 3) 0 1 => 1 3%2=1
f(3, 3) 0 1 2 => 0 1 3%3=0
f(4, 3) 0 1 2 3 => 3 0 1 3%4=3
f(5, 3) 0 1 2 3 4 => 3 4 0 1 3%5=3
f(6, 3) 0 1 2 3 4 5 => 3 4 5 0 1 3%6=3

一. 找出等价函数

规律:下次报数的起点为 𝑘=𝑚%𝑛

  • 首次出列人的序号是 𝑘−1,剩下的的 𝑛−1 个人重新组成约瑟夫环
  • 下次从 𝑘 开始数,序号如下
    • 𝑘, 𝑘+1, … , 0, 1, 𝑘−2,如上例中 3 4 5 0 1

这个函数称之为 𝑔(𝑛−1,𝑚),它的最终结果与 𝑓(𝑛,𝑚) 是相同的。

二. 找到映射函数

现在想办法找到 𝑔(𝑛−1,𝑚) 与 𝑓(𝑛−1,𝑚) 的对应关系,即

$$
3 \rightarrow 0 \4 \rightarrow 1 \5 \rightarrow 2 \0 \rightarrow 3 \1 \rightarrow 4 \
$$
映射函数为

𝑚𝑎𝑝𝑝𝑖𝑛𝑔(𝑥)={𝑥−𝑘𝑥=[𝑘…𝑛−1]𝑥+𝑛−𝑘𝑥=[0…𝑘−2]

等价于下面函数

𝑚𝑎𝑝𝑝𝑖𝑛𝑔(𝑥)=(𝑥+𝑛−𝑘)%𝑛

代入测试一下

$$
3 \rightarrow (3+6-3)%6 \rightarrow 0 \4 \rightarrow (4+6-3)%6 \rightarrow 1 \5 \rightarrow (5+6-3)%6 \rightarrow 2 \0 \rightarrow (0+6-3)%6 \rightarrow 3 \1 \rightarrow (1+6-3)%6 \rightarrow 4 \
$$
综上有

𝑓(𝑛−1,𝑚)=𝑚𝑎𝑝𝑝𝑖𝑛𝑔(𝑔(𝑛−1,𝑚))

三. 求逆映射函数

映射函数是根据 x 计算 y,逆映射函数即根据 y 得到 x

𝑚𝑎𝑝𝑝𝑖𝑛𝑔−1(𝑥)=(𝑥+𝑘)%𝑛

代入测试一下

$$
0 \rightarrow (0+3)%6 \rightarrow 3 \1 \rightarrow (1+3)%6 \rightarrow 4 \2 \rightarrow (2+3)%6 \rightarrow 5 \3 \rightarrow (3+3)%6 \rightarrow 0 \4 \rightarrow (4+3)%6 \rightarrow 1 \
$$
因此可以求得

𝑔(𝑛−1,𝑚)=𝑚𝑎𝑝𝑝𝑖𝑛𝑔−1(𝑓(𝑛−1,𝑚))

四. 递推式

代入推导

$$
\begin{aligned}f(n,m) = \ & g(n-1,m) \= \ & mapping^{-1}(f(n-1,m)) \= \ & (f(n-1,m) + k) % n \= \ & (f(n-1,m) + m%n) % n \= \ & (f(n-1,m) + m) % n \\end{aligned}
$$
最后一步化简是利用了模运算法则

(𝑎+𝑏)%𝑛=(𝑎%𝑛+𝑏%𝑛)%𝑛 例如

  • (6+6)%5=2=(6+6%5)%5
  • (6+5)%5=1=(6+5%5)%5
  • (6+4)%5=0=(6+4%5)%5

最终递推式

$$
f(n,m) = \begin{cases}(f(n-1,m) + m) % n & n>1\0 & n = 1\end{cases}
$$

1
2
3
4
5
6
7
8
9
10
11
12
13
14
public class JosephusProblem {
public static int josephus(int n, int m) {
int res = 0; // 当n=1时,存活者位置是0
for (int i = 2; i <= n; i++) { // 从2个人开始递推
res = (res + m) % i; // 递推公式核心
}
return res; // 返回0-based索引
}

public static void main(String[] args) {
System.out.println(josephus(5, 3)); // 输出3
System.out.println(josephus(6, 3)); // 输出0
}
}

约瑟夫环问题 一共有1~n这些点,组成首尾相接的环 从1号点从数字1开始报数,哪个节点报到数字k,就删除该节点 然后下一个节点从数字1开始重新报数,最终环上会剩下一个节点 返回该节点的编号

1 <= n, k <= 10^6

测试链接 : https://www.luogu.com.cn/problem/P8671

环的大小用c表示,c = 1时,ans = 1,利用如下公式依次计算ans,当c = n时,ans就是答案 ans = (ans + k - 1) % c + 1

思路:

老编号 = ? 新编号

n = 10 被杀节点为S = 4

老 1 2 3 [4] 5 6 7 8 9 10

新 7 8 9 1 2 3 4 5 6

观察: 可以画一个二维坐标 把点标出来 发现是可以退出一个公式的!

image-20250324215641085.png

剃刀的函数% 是可以做出来的

老 = (新+S-1) % n + 1

比如: 老编号的 5 新编号 (1 + 4 - 1) % 10 + 1 = 5 成立

但是k 为报数编号,S为被杀节点 所以我们还要知道S 和 K的关系

image-20250324220037866.png

S = (K-1)%n + 1

把S 带入老 = (新+S-1) % n + 1中

老 = (新 + (k-1)%n +1 - 1) %n + 1 k-1 = t*n+r 肯定可以这么写 所以应该是 (新 + r)%n +1 k-1 = tn+r 也可以把 r消掉 是等效的

我们进一步化简: 老 = (新 + K -1) % n +1 这就是公式最终的样子

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
import java.io.BufferedReader;
import java.io.IOException;
import java.io.InputStreamReader;
import java.io.PrintWriter;
import java.io.StreamTokenizer;
public class Joseph {
public static int compute(int n,int k){
int ans = 1;
for(int c = 2;c<=n;c++){
ans = (ans + k-1) % c + 1;
}
}
public static void main(String[] args) throw IOException {
BufferedReader br = new BufferedReader(new InputStreamReader(System.in));
StreamTokenizer in = new StreamTokenizer(br);
PrintWriter out = new PrintWriter(new OutputStreamWriter(System.out));
in.nextToken();
int n = (int)in.nval; //多少个节点
in.nextToken();
int k = (int)in.nval; //报到几就杀
out.println(compute(n,k));
out.close();
br.close();
}
}

P8671 [蓝桥杯 2018 国 AC] 约瑟夫环

题目描述

$n$ 个人的编号是 $1 \sim n$,如果他们依编号按顺时针排成一个圆圈,从编号是 $1$ 的人开始顺时针报数。

(报数是从 $1$ 报起)当报到 $k$ 的时候,这个人就退出游戏圈。下一个人重新从 $1$ 开始报数。

求最后剩下的人的编号。这就是著名的约瑟夫环问题。

本题目就是已知 $n$,$k$ 的情况下,求最后剩下的人的编号。

输入格式

题目的输入是一行,$2$ 个空格分开的整数 $n,k$。

输出格式

要求输出一个整数,表示最后剩下的人的编号。

输入输出样例

输入

1
10 3

输出

1
4

说明/提示

$0<n,k<10^6$。

时限 1 秒, 256M。蓝桥杯 2018 年第九届国赛

1

约瑟夫环问题加强

一共有1~n这些点,组成首尾相接的环,游戏一共有n-1轮,每轮给定一个数字arr[i] 第一轮游戏中,1号点从数字1开始报数,哪个节点报到数字arr[1],就删除该节点 然后下一个节点从数字1开始重新报数,游戏进入第二轮 第i轮游戏中,哪个节点报到数字arr[i],就删除该节点 然后下一个节点从数字1开始重新报数,游戏进入第i+1轮 最终环上会剩下一个节点, 返回该节点的编号 1 <= n, arr[i] <= 10^6

来自真实大厂笔试,对数器验证

思路:

k 不同

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
package class146;

// 约瑟夫环问题加强
// 一共有1~n这些点,组成首尾相接的环,游戏一共有n-1轮,每轮给定一个数字arr[i]
// 第一轮游戏中,1号点从数字1开始报数,哪个节点报到数字arr[1],就删除该节点
// 然后下一个节点从数字1开始重新报数,游戏进入第二轮
// 第i轮游戏中,哪个节点报到数字arr[i],就删除该节点
// 然后下一个节点从数字1开始重新报数,游戏进入第i+1轮
// 最终环上会剩下一个节点, 返回该节点的编号
// 1 <= n, arr[i] <= 10^6
// 来自真实大厂笔试,对数器验证
public class Code04_JosephFollowUp {

// 暴力模拟
// 为了测试
public static int joseph1(int n, int[] arr) {
if (n == 1) {
return 1;
}
int[] next = new int[n + 1];
for (int i = 1; i < n; i++) {
next[i] = i + 1;
}
next[n] = 1;
int pre = n, cur = 1;
for (int i = 1; i < n; i++) {
for (int cnt = 1; cnt < arr[i]; cnt++) {
pre = cur;
cur = next[cur];
}
next[pre] = next[cur];
cur = next[cur];
}
return cur;
}

// 正式方法
// 时间复杂度O(n)
public static int joseph2(int n, int[] arr) {
if (n == 1) {
return 1;
}
int ans = 1;
for (int c = 2, i = n - 1; c <= n; c++, i--) {
ans = (ans + arr[i] - 1) % c + 1;
}
return ans;
}

// 随机生成每轮报数
// 为了测试
public static int[] randomArray(int n, int v) {
int[] arr = new int[n];
for (int i = 1; i < n; i++) {
arr[i] = (int) (Math.random() * v) + 1;
}
return arr;
}

// 对数器
// 为了测试
public static void main(String[] args) {
int N = 100;
int V = 500;
int test = 10000;
System.out.println("测试开始");
for (int i = 1; i <= test; i++) {
int n = (int) (Math.random() * N) + 1;
int[] arr = randomArray(n, V);
int ans1 = joseph1(n, arr);
int ans2 = joseph2(n, arr);
if (ans1 != ans2) {
System.out.println("出错了!");
}
}
System.out.println("测试结束");
}

}


3) 多路递归 Multi Recursion

E01. 斐波那契数列-Leetcode 70

  • 之前的例子是每个递归函数只包含一个自身的调用,这称之为 single recursion
  • 如果每个递归函数例包含多个自身调用,称之为 multi recursion

递推关系

𝑓(𝑛)={0𝑛=01𝑛=1𝑓(𝑛−1)+𝑓(𝑛−2)𝑛>1

下面的表格列出了数列的前几项

F0 F1 F2 F3 F4 F5 F6 F7 F8 F9 F10 F11 F12 F13
0 1 1 2 3 5 8 13 21 34 55 89 144 233

实现

1
2
3
4
5
6
7
8
9
public static int f(int n) {
if (n == 0) {
return 0;
}
if (n == 1) {
return 1;
}
return f(n - 1) + f(n - 2);
}

执行流程

image-20250321085827514.png

  • 绿色代表正在执行(对应递),灰色代表执行结束(对应归)
  • 递不到头,不能归,对应着深度优先搜索

时间复杂度

  • 递归的次数也符合斐波那契规律,2∗𝑓(𝑛+1)−1
  • 时间复杂度推导过程
    • 斐波那契通项公式 𝑓(𝑛)=15∗(1+52𝑛−1−52𝑛)
    • 简化为:𝑓(𝑛)=12.236∗(1.618𝑛−(−0.618)𝑛)
    • 带入递归次数公式 2∗12.236∗(1.618𝑛+1−(−0.618)𝑛+1)−1
    • 时间复杂度为 Θ(1.618𝑛)
  1. 更多 Fibonacci 参考[^8][^9][^10]
  2. 以上时间复杂度分析,未考虑大数相加的因素

变体1 - 兔子问题[^8]

image-20250321090820510.png

  • 第一个月,有一对未成熟的兔子(黑色,注意图中个头较小)
  • 第二个月,它们成熟
  • 第三个月,它们能产下一对新的小兔子(蓝色)
  • 所有兔子遵循相同规律,求第 𝑛 个月的兔子数

分析

兔子问题如何与斐波那契联系起来呢?设第 n 个月兔子数为 𝑓(𝑛)

  • 𝑓(𝑛) = 上个月兔子数 + 新生的小兔子数
  • 而【新生的小兔子数】实际就是【上个月成熟的兔子数】
  • 因为需要一个月兔子就成熟,所以【上个月成熟的兔子数】也就是【上上个月的兔子数】
  • 上个月兔子数,即 𝑓(𝑛−1)
  • 上上个月的兔子数,即 𝑓(𝑛−2)

因此本质还是斐波那契数列,只是从其第一项开始

变体2 - 青蛙爬楼梯

  • 楼梯有 𝑛 阶
  • 青蛙要爬到楼顶,可以一次跳一阶,也可以一次跳两阶
  • 只能向上跳,问有多少种跳法

分析

n 跳法 规律
1 (1) 暂时看不出
2 (1,1) (2) 暂时看不出
3 (1,1,1) (1,2) (2,1) 暂时看不出
4 (1,1,1,1) (1,2,1) (2,1,1)
(1,1,2) (2,2)
最后一跳,跳一个台阶的,基于f(3)
最后一跳,跳两个台阶的,基于f(2)
5

E02. 汉诺塔[^13](多路递归)

Tower of Hanoi,是一个源于印度古老传说:大梵天创建世界时做了三根金刚石柱,在一根柱子从下往上按大小顺序摞着 64 片黄金圆盘,大梵天命令婆罗门把圆盘重新摆放在另一根柱子上,并且规定

  • 一次只能移动一个圆盘
  • 小圆盘上不能放大圆盘

下面的动图演示了4片圆盘的移动方法

使用程序代码模拟圆盘的移动过程,并估算出时间复杂度

思路

  • 假设每根柱子标号 a,b,c,每个圆盘用 1,2,3 … 表示其大小,圆盘初始在 a,要移动到的目标是 c

  • 如果只有一个圆盘,此时是最小问题,可以直接求解

    • 移动圆盘1 𝑎↦𝑐

    image-20250326151737446.png

  • 如果有两个圆盘,那么

    • 圆盘1 𝑎↦𝑏
    • 圆盘2 𝑎↦𝑐
    • 圆盘1 𝑏↦𝑐

    image-20250326151811029.png

  • 如果有三个圆盘,那么

    • 圆盘12 𝑎↦𝑏
    • 圆盘3 𝑎↦𝑐
    • 圆盘12 𝑏↦𝑐

    image-20250326151859034.png

  • 如果有四个圆盘,那么

    • 圆盘 123 𝑎↦𝑏
    • 圆盘4 𝑎↦𝑐
    • 圆盘 123 𝑏↦𝑐

image-20250326151917550.png

题解

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
public class E02HanoiTower {


/*
源 借 目
h(4, a, b, c) -> h(3, a, c, b)
a -> c
h(3, b, a, c)
*/
static LinkedList<Integer> a = new LinkedList<>();
static LinkedList<Integer> b = new LinkedList<>();
static LinkedList<Integer> c = new LinkedList<>();

static void init(int n) {
for (int i = n; i >= 1; i--) {
a.add(i);
}
}

static void h(int n, LinkedList<Integer> a,
LinkedList<Integer> b,
LinkedList<Integer> c) {
if (n == 0) {
return;
}
h(n - 1, a, c, b);
c.addLast(a.removeLast());
print();
h(n - 1, b, a, c);
}

private static void print() {
System.out.println("-----------------------");
System.out.println(a);
System.out.println(b);
System.out.println(c);
}

public static void main(String[] args) {
init(3);
print();
h(3, a, b, c);
}
}

E03. 杨辉三角[^6]

image-20250326152211969.png

分析

把它斜着看

1
2
3
4
5
        1
1 1
1 2 1
1 3 3 1
1 4 6 4 1
  • 行 𝑖,列 𝑗,那么[𝑖][𝑗]的取值应为 [𝑖−1][𝑗−1]+[𝑖−1][𝑗]
  • 当 𝑗=0 或 𝑖=𝑗 时,[𝑖][𝑗] 取值为 1

题解

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
public static void print(int n) {
for (int i = 0; i < n; i++) {
if (i < n - 1) {
System.out.printf("%" + 2 * (n - 1 - i) + "s", " ");
}

for (int j = 0; j < i + 1; j++) {
System.out.printf("%-4d", element(i, j));
}
System.out.println();
}
}

public static int element(int i, int j) {
if (j == 0 || i == j) {
return 1;
}
return element(i - 1, j - 1) + element(i - 1, j);
}

优化1

是 multiple recursion,因此很多递归调用是重复的,例如

  • recursion(3, 1) 分解为
    • recursion(2, 0) + recursion(2, 1)
  • 而 recursion(3, 2) 分解为
    • recursion(2, 1) + recursion(2, 2)

这里 recursion(2, 1) 就重复调用了,事实上它会重复很多次,可以用 static AtomicInteger counter = new AtomicInteger(0) 来查看递归函数的调用总次数

事实上,可以用 memoization 来进行优化:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
public static void print1(int n) {
int[][] triangle = new int[n][];
for (int i = 0; i < n; i++) {
// 打印空格
triangle[i] = new int[i + 1];
for (int j = 0; j <= i; j++) {
System.out.printf("%-4d", element1(triangle, i, j));
}
System.out.println();
}
}

public static int element1(int[][] triangle, int i, int j) {
if (triangle[i][j] > 0) {
return triangle[i][j];
}

if (j == 0 || i == j) {
triangle[i][j] = 1;
return triangle[i][j];
}
triangle[i][j] = element1(triangle, i - 1, j - 1) + element1(triangle, i - 1, j);
return triangle[i][j];
}
  • 将数组作为递归函数内可以访问的遍历,如果 𝑡𝑟𝑖𝑎𝑛𝑔𝑙𝑒[𝑖][𝑗] 已经有值,说明该元素已经被之前的递归函数计算过,就不必重复计算了

优化2

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
public static void print2(int n) {
int[] row = new int[n];
for (int i = 0; i < n; i++) {
// 打印空格
createRow(row, i);
for (int j = 0; j <= i; j++) {
System.out.printf("%-4d", row[j]);
}
System.out.println();
}
}

private static void createRow(int[] row, int i) {
if (i == 0) {
row[0] = 1;
return;
}
for (int j = i; j > 0; j--) {
row[j] = row[j - 1] + row[j];
}
}

注意:还可以通过每一行的前一项计算出下一项,不必借助上一行,这与杨辉三角的另一个特性有关,暂不展开了

其它题目

力扣对应题目,但递归不适合在力扣刷高分,因此只列出相关题目,不做刷题讲解了

题号 名称
Leetcode118 杨辉三角
Leetcode119 杨辉三角II

4) 递归优化-记忆法

上述代码存在很多重复的计算,例如求 𝑓(5) 递归分解过程

image-20250326152653800.png

可以看到(颜色相同的是重复的):

  • 𝑓(3) 重复了 2 次
  • 𝑓(2) 重复了 3 次
  • 𝑓(1) 重复了 5 次
  • 𝑓(0) 重复了 3 次

随着 𝑛 的增大,重复次数非常可观,如何优化呢?

Memoization 记忆法(也称备忘录)是一种优化技术,通过存储函数调用结果(通常比较昂贵),当再次出现相同的输入(子问题)时,就能实现加速效果,改进后的代码

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
public static void main(String[] args) {
int n = 13;
int[] cache = new int[n + 1];
Arrays.fill(cache, -1);
cache[0] = 0;
cache[1] = 1;
System.out.println(f(cache, n));
}

public static int f(int[] cache, int n) {
if (cache[n] != -1) {
return cache[n];
}

cache[n] = f(cache, n - 1) + f(cache, n - 2);
return cache[n];
}

优化后的图示,只要结果被缓存,就不会执行其子问题

image-20250326153008553.png

  • 改进后的时间复杂度为 𝑂(𝑛)
  • 请自行验证改进后的效果
  • 请自行分析改进后的空间复杂度

注意

  1. 记忆法是动态规划的一种情况,强调的是自顶向下的解决
  2. 记忆法的本质是空间换时间

5) 递归优化-尾递归

爆栈

用递归做 𝑛+(𝑛−1)+(𝑛−2)…+1

1
2
3
4
5
6
public static long sum(long n) {
if (n == 1) {
return 1;
}
return n + sum(n - 1);
}

在我的机器上 𝑛=12000 时,爆栈了

1
2
3
4
5
6
7
Exception in thread "main" java.lang.StackOverflowError
at Test.sum(Test.java:10)
at Test.sum(Test.java:10)
at Test.sum(Test.java:10)
at Test.sum(Test.java:10)
at Test.sum(Test.java:10)
...

为什么呢?

  • 每次方法调用是需要消耗一定的栈内存的,这些内存用来存储方法参数、方法内局部变量、返回地址等等
  • 方法调用占用的内存需要等到方法结束时才会释放
  • 而递归调用我们之前讲过,不到最深不会回头,最内层方法没完成之前,外层方法都结束不了
    • 例如,𝑠𝑢𝑚(3) 这个方法内有个需要执行 3+𝑠𝑢𝑚(2),𝑠𝑢𝑚(2) 没返回前,加号前面的 3 不能释放
    • 看下面伪码
1
2
3
4
5
6
7
long sum(long n = 3) {
return 3 + long sum(long n = 2) {
return 2 + long sum(long n = 1) {
return 1;
}
}
}

尾调用

如果函数的最后一步是调用一个函数,那么称为尾调用,例如

1
2
3
function a() {
return b()
}

下面三段代码不能叫做尾调用

1
2
3
4
function a() {
const c = b()
return c
}
  • 因为最后一步并非调用函数
1
2
3
function a() {
return b() + 1
}
  • 最后一步执行的是加法
1
2
3
function a(x) {
return b() + x
}
  • 最后一步执行的是加法

一些语言[^11]的编译器能够对尾调用做优化,例如

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
function a() {
// 做前面的事
return b()
}

function b() {
// 做前面的事
return c()
}

function c() {
return 1000
}

a()

没优化之前的伪码

1
2
3
4
5
6
7
function a() {
return function b() {
return function c() {
return 1000
}
}
}

优化后伪码如下

1
2
3
a()
b()
c()

为何尾递归才能优化?

调用 a 时

  • a 返回时发现:没什么可留给 b 的,将来返回的结果 b 提供就可以了,用不着我 a 了,我的内存就可以释放

调用 b 时

  • b 返回时发现:没什么可留给 c 的,将来返回的结果 c 提供就可以了,用不着我 b 了,我的内存就可以释放

如果调用 a 时

  • 不是尾调用,例如 return b() + 1,那么 a 就不能提前结束,因为它还得利用 b 的结果做加法

尾递归

尾递归是尾调用的一种特例,也就是最后一步执行的是同一个函数

尾递归避免爆栈

安装 Scala

image-20250326153235986.png

Scala 入门

1
2
3
4
5
object Main {
def main(args: Array[String]): Unit = {
println("Hello Scala")
}
}
  • Scala 是 java 的近亲,java 中的类都可以拿来重用
  • 类型是放在变量后面的
  • Unit 表示无返回值,类似于 void
  • 不需要以分号作为结尾,当然加上也对

还是先写一个会爆栈的函数

1
2
3
4
5
6
def sum(n: Long): Long = {
if (n == 1) {
return 1
}
return n + sum(n - 1)
}
  • Scala 最后一行代码若作为返回值,可以省略 return

不出所料,在 𝑛=11000 时,还是出了异常

1
2
3
4
5
6
7
8
println(sum(11000))

Exception in thread "main" java.lang.StackOverflowError
at Main$.sum(Main.scala:25)
at Main$.sum(Main.scala:25)
at Main$.sum(Main.scala:25)
at Main$.sum(Main.scala:25)
...

这是因为以上代码,还不是尾调用,要想成为尾调用,那么:

  1. 最后一行代码,必须是一次函数调用
  2. 内层函数必须摆脱与外层函数的关系,内层函数执行后不依赖于外层的变量或常量
1
2
3
4
5
6
def sum(n: Long): Long = {
if (n == 1) {
return 1
}
return n + sum(n - 1) // 依赖于外层函数的 n 变量
}

如何让它执行后就摆脱对 n 的依赖呢?

  • 不能等递归回来再做加法,那样就必须保留外层的 n
  • 把 n 当做内层函数的一个参数传进去,这时 n 就属于内层函数了
  • 传参时就完成累加, 不必等回来时累加
1
sum(n - 1, n + 累加器)

改写后代码如下

1
2
3
4
5
6
7
@tailrec
def sum(n: Long, accumulator: Long): Long = {
if (n == 1) {
return 1 + accumulator
}
return sum(n - 1, n + accumulator)
}
  • accumulator 作为累加器
  • @tailrec 注解是 scala 提供的,用来检查方法是否符合尾递归
  • 这回 sum(10000000, 0) 也没有问题,打印 50000005000000

执行流程如下,以伪码表示 𝑠𝑢𝑚(4,0)

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
// 首次调用
def sum(n = 4, accumulator = 0): Long = {
return sum(4 - 1, 4 + accumulator)
}

// 接下来调用内层 sum, 传参时就完成了累加, 不必等回来时累加,当内层 sum 调用后,外层 sum 空间没必要保留
def sum(n = 3, accumulator = 4): Long = {
return sum(3 - 1, 3 + accumulator)
}

// 继续调用内层 sum
def sum(n = 2, accumulator = 7): Long = {
return sum(2 - 1, 2 + accumulator)
}

// 继续调用内层 sum, 这是最后的 sum 调用完就返回最后结果 10, 前面所有其它 sum 的空间早已释放
def sum(n = 1, accumulator = 9): Long = {
if (1 == 1) {
return 1 + accumulator
}
}

本质上,尾递归优化是将函数的递归调用,变成了函数的循环调用

改循环避免爆栈

1
2
3
4
5
6
7
8
public static void main(String[] args) {
long n = 100000000;
long sum = 0;
for (long i = n; i >= 1; i--) {
sum += i;
}
System.out.println(sum);
}

6) 递归时间复杂度-Master theorem[^14]

若有递归式

𝑇(𝑛)=𝑎𝑇(𝑛𝑏)+𝑓(𝑛)

其中

  • 𝑇(𝑛) 是问题的运行时间,𝑛 是数据规模
  • 𝑎 是子问题个数
  • 𝑇(𝑛𝑏) 是子问题运行时间,每个子问题被拆成原问题数据规模的 𝑛𝑏
  • 𝑓(𝑛) 是除递归外执行的计算

令 𝑥=log𝑏⁡𝑎,即 子问题缩小倍数子问题个数𝑥=log子问题缩小倍数⁡子问题个数

那么

并且并且𝑇(𝑛)={Θ(𝑛𝑥)𝑓(𝑛)=𝑂(𝑛𝑐)并且𝑐<𝑥Θ(𝑛𝑥log⁡𝑛)𝑓(𝑛)=Θ(𝑛𝑥)Θ(𝑛𝑐)𝑓(𝑛)=Ω(𝑛𝑐)并且𝑐>𝑥

例1

𝑇(𝑛)=2𝑇(𝑛2)+𝑛4

  • 此时 𝑥=1<4,由后者决定整个时间复杂度 Θ(𝑛4)
  • 如果觉得对数不好算,可以换为求【𝑏 的几次方能等于 𝑎】

例2

𝑇(𝑛)=𝑇(7𝑛10)+𝑛

  • 𝑎=1,𝑏=107,𝑥=0,𝑐=1
  • 此时 𝑥=0<1,由后者决定整个时间复杂度 Θ(𝑛)

例3

𝑇(𝑛)=16𝑇(𝑛4)+𝑛2

  • 𝑎=16,𝑏=4,𝑥=2,𝑐=2
  • 此时 𝑥=2=𝑐,时间复杂度 Θ(𝑛2log⁡𝑛)

例4

𝑇(𝑛)=7𝑇(𝑛3)+𝑛2

  • 𝑎=7,𝑏=3,𝑥=1.?,𝑐=2
  • 此时 𝑥=log3⁡7<2,由后者决定整个时间复杂度 Θ(𝑛2)

例5

𝑇(𝑛)=7𝑇(𝑛2)+𝑛2

  • 𝑎=7,𝑏=2,𝑥=2.?,𝑐=2
  • 此时 𝑥=𝑙𝑜𝑔27>2,由前者决定整个时间复杂度 Θ(𝑛log2⁡7)

例6

𝑇(𝑛)=2𝑇(𝑛4)+𝑛

  • 𝑎=2,𝑏=4,𝑥=0.5,𝑐=0.5
  • 此时 𝑥=0.5=𝑐,时间复杂度 Θ(𝑛 log⁡𝑛)

例7. 二分查找递归

1
2
3
4
5
6
7
8
9
10
11
12
13
int f(int[] a, int target, int i, int j) {
if (i > j) {
return -1;
}
int m = (i + j) >>> 1;
if (target < a[m]) {
return f(a, target, i, m - 1);
} else if (a[m] < target) {
return f(a, target, m + 1, j);
} else {
return m;
}
}
  • 子问题个数 𝑎=1
  • 子问题数据规模缩小倍数 𝑏=2
  • 除递归外执行的计算是常数级 𝑐=0

𝑇(𝑛)=𝑇(𝑛2)+𝑛0

  • 此时 𝑥=0=𝑐,时间复杂度 Θ(log⁡𝑛)

例8. 归并排序递归

1
2
3
4
5
6
7
8
9
10
11
12
13
void split(B[], i, j, A[])
{
if (j - i <= 1)
return;
m = (i + j) / 2;

// 递归
split(A, i, m, B);
split(A, m, j, B);

// 合并
merge(B, i, m, j, A);
}
  • 子问题个数 𝑎=2
  • 子问题数据规模缩小倍数 𝑏=2
  • 除递归外,主要时间花在合并上,它可以用 𝑓(𝑛)=𝑛 表示

𝑇(𝑛)=2𝑇(𝑛2)+𝑛

  • 此时 𝑥=1=𝑐,时间复杂度 Θ(𝑛log⁡𝑛)

例9. 快速排序递归

1
2
3
4
5
6
7
8
9
10
algorithm quicksort(A, lo, hi) is 
if lo >= hi || lo < 0 then
return

// 分区
p := partition(A, lo, hi)

// 递归
quicksort(A, lo, p - 1)
quicksort(A, p + 1, hi)
  • 子问题个数 𝑎=2
  • 子问题数据规模缩小倍数
    • 如果分区分的好,𝑏=2
    • 如果分区没分好,例如分区1 的数据是 0,分区 2 的数据是 𝑛−1
  • 除递归外,主要时间花在分区上,它可以用 𝑓(𝑛)=𝑛 表示

情况1 - 分区分的好

𝑇(𝑛)=2𝑇(𝑛2)+𝑛

  • 此时 𝑥=1=𝑐,时间复杂度 Θ(𝑛log⁡𝑛)

情况2 - 分区没分好

𝑇(𝑛)=𝑇(𝑛−1)+𝑇(1)+𝑛

  • 此时不能用主定理求解

7) 递归时间复杂度-展开求解

像下面的递归式,都不能用主定理求解

例1 - 递归求和

1
2
3
4
5
6
long sum(long n) {
if (n == 1) {
return 1;
}
return n + sum(n - 1);
}

𝑇(𝑛)=𝑇(𝑛−1)+𝑐,𝑇(1)=𝑐

下面为展开过程

𝑇(𝑛)=𝑇(𝑛−2)+𝑐+𝑐

𝑇(𝑛)=𝑇(𝑛−3)+𝑐+𝑐+𝑐

𝑇(𝑛)=𝑇(𝑛−(𝑛−1))+(𝑛−1)𝑐

  • 其中 𝑇(𝑛−(𝑛−1)) 即 𝑇(1)
  • 带入求得 𝑇(𝑛)=𝑐+(𝑛−1)𝑐=𝑛𝑐

时间复杂度为 𝑂(𝑛)

例2 - 递归冒泡排序

1
2
3
4
5
6
7
8
9
10
11
void bubble(int[] a, int high) {
if(0 == high) {
return;
}
for (int i = 0; i < high; i++) {
if (a[i] > a[i + 1]) {
swap(a, i, i + 1);
}
}
bubble(a, high - 1);
}

𝑇(𝑛)=𝑇(𝑛−1)+𝑛,𝑇(1)=𝑐

下面为展开过程

𝑇(𝑛)=𝑇(𝑛−2)+(𝑛−1)+𝑛

𝑇(𝑛)=𝑇(𝑛−3)+(𝑛−2)+(𝑛−1)+𝑛

𝑇(𝑛)=𝑇(1)+2+…+𝑛=𝑇(1)+(𝑛−1)2+𝑛2=𝑐+𝑛22+𝑛2−1

时间复杂度 𝑂(𝑛2)

注:

  • 等差数列求和为 个数首项末项个数∗|首项−末项|2

例3 - 递归快排

快速排序分区没分好的极端情况

𝑇(𝑛)=𝑇(𝑛−1)+𝑇(1)+𝑛,𝑇(1)=𝑐

𝑇(𝑛)=𝑇(𝑛−1)+𝑐+𝑛

下面为展开过程

𝑇(𝑛)=𝑇(𝑛−2)+𝑐+(𝑛−1)+𝑐+𝑛

𝑇(𝑛)=𝑇(𝑛−3)+𝑐+(𝑛−2)+𝑐+(𝑛−1)+𝑐+𝑛

𝑇(𝑛)=𝑇(𝑛−(𝑛−1))+(𝑛−1)𝑐+2+…+𝑛=𝑛22+2𝑐𝑛+𝑛2−1

时间复杂度 𝑂(𝑛2)

不会推导的同学可以进入 https://www.wolframalpha.com/

  • 例1 输入 f(n) = f(n - 1) + c, f(1) = c
  • 例2 输入 f(n) = f(n - 1) + n, f(1) = c
  • 例3 输入 f(n) = f(n - 1) + n + c, f(1) = c