0%

如何理解和正确使用递归

何为递归?

  1. 递归是一种应用非常广泛的算法(或者编程技巧)。很多数据结构和算法的编码实现都要用到递归,比如 DFS 深度优先搜索、前中后序二叉树遍历等等。
  2. 方法或函数调用自身的方式称为递归调用,调用的过程叫“递”,返回的过程叫“归”。

为什么使用递归?递归的优缺点?

  • 优点:代码简洁,易于理解。(如在树的前/中/后序遍历中,递归的实现明显比循环简单。)
  • 缺点:时间和空间的消耗较大,存在重复计算,有堆栈溢出风险。

递归需要满足的三个条件

一个问题只要同时满足以下3个条件,就可以用递归来解决:

  1. 一个问题的解可以分解为几个子问题的解
  2. 这个问题与分解之后的子问题,除了数据规模不同,求解思路完全一样
  3. 存在递归终止条件

如何编写递归代码?

写递归代码的关键就是找到如何将大问题分解为小问题的规律,并且基于此写出递推公式,然后再推敲终止条件,最后将递推公式和终止条件翻译成代码。

  1. 先把递归终止条件和递推公式放到一起
    1
    2
    3
    f(1) = 1;
    f(2) = 2;
    f(n) = f(n-1)+f(n-2)
  2. 再转化成递归代码
    1
    2
    3
    4
    5
    int f(int n) {
    if (n == 1) return 1;
    if (n == 2) return 2;
    return f(n-1) + f(n-2);
    }

如何理解递归代码

对于递归代码,如果试图想清楚整个递和归过程的做法,实际上是进入了一个思维误区。很多时候,我们理解起来比较吃力,主要原因就是自己给自己制造了这种理解障碍。那正确的思维方式应该是怎样的呢?

如果一个问题 A 可以分解为若干子问题 B、C、D,你可以假设子问题 B、C、D 已经解决,在此基础上思考如何解决问题 A。而且,你只需要思考问题 A 与子问题 B、C、D 两层之间的关系即可,不需要一层一层往下思考子问题与子子问题,子子问题与子子子问题之间的关系。屏蔽掉递归细节,这样子理解起来就简单多了。

因此,只要遇到递归,我们就把它抽象成一个递推公式,不用想一层层的调用关系,不要试图用人脑去分解递归的每个步骤。

递归常见问题

堆栈溢出

函数调用会使用栈来保存临时变量。每调用一个函数,都会将临时变量封装为栈帧压入内存栈,等函数执行完成返回时,才出栈。系统栈或者虚拟机栈空间一般都不大。如果递归求解的数据规模很大,调用层次很深,一直压入栈,就会有堆栈溢出的风险。

解决方案:
可以通过在代码中限制递归调用的最大深度,超过直接返回报错。伪代码举例如下:

1
2
3
4
5
6
7
8
9
10
11
// 该例子只适用于一个f分解为一个f
// 全局变量,表示递归的深度。
int depth = 0;

int f(int n) {
++depth;
if (depth > 1000) throw exception;

if (n == 1) return 1;
return f(n-1) + 1;
}

但这种做法并不能完全解决问题,因为最大允许的递归深度跟当前线程剩余的栈空间大小有关,事先无法计算。如果实时计算,代码过于复杂,就会影响代码的可读性。

重复计算

为了避免重复计算,我们可以通过一个数据结构(比如散列表)来保存已经求解过的 f(k)。当递归调用到 f(k) 时,先看下是否已经求解过了。如果是,则直接从散列表中取值返回,不需要重复计算。

小结

  • 递归是一种非常高效、简洁的编码技巧。只要是满足“三个条件”的问题就可以通过递归代码来解决。
  • 不过递归代码也比较难写、难理解。编写递归代码的关键就是不要把自己绕进去,正确姿势是写出递推公式,找出终止条件,然后再翻译成递归代码。
  • 递归代码虽然简洁高效,但是,递归代码也有很多弊端。比如,堆栈溢出、重复计算、函数调用耗时多、空间复杂度高等,所以,在编写递归代码的时候,一定要控制好这些副作用。

如何调试递归代码呢?

  1. 打印日志发现,递归值。
  2. 结合条件断点进行调试。

调试递归就像写递归一样,不要被每一步的细节所困,重点在于确认递推关系与结束条件是否正确,用条件断点着重调试最初两步与最终两步即可。

记于: 2020/03/15 15:30:00