13 搜索:如何掌握DFS与BFS的解题套路?
文章目录
深度优先遍历(Depth First Search,简称 DFS) 与广度优先遍历(Breath First Search,简称 BFS)是图论中两种非常重要的算法,生产上广泛用于拓扑排序、寻路(走迷宫)、搜索引擎、爬虫等。因此,算法面试也经常考察这两种搜索算法。
在本讲,我们将重点介绍面试中常用的 DFS 与 BFS 代码技巧。学完本讲,你将收获:
DFS 搜索与剪枝
BFS 搜索与剪枝
让我们马上开始。
DFS 概述
在玩迷宫游戏的时候,使用的策略就是 DFS,也就是当一条路走不通的时候,我们再尝试换一条路,直到走通为止。
下面我们也从这个游戏展开,一步一步得到常用的 DFS 解题模板。以下图为例,位置 0 表示出发点,然后只能上下左右四个方向移动,我们希望能从圆圈位置出发,最后走到五角星的终点位置。
比如,刚从入口出发的时候,我们可以走到 1、2 这两个位置。如果用伪代码进表示,可以写出如下代码:
|
|
通过上面这样直白的代码,已经可以清晰地表达我们的思路了。但是还存在一些问题,下面我们一步一步讨论。
问题 1
后面能走的位置只有 2 个的时候,处理起来是比较好写的。但是如果有很多位置都可以走呢?发现这种情况,就是时候用循环来改写我们的 DFS 模板了。
|
|
问题 2
虽然上述代码中引入了 success 变量,但是并没有讨论什么时候才是 success。不过走迷宫,肯定是找到最终出口,才算是成功。于是我们可以将代码改写如下:
|
|
问题 3
另外,我们还需要处理一些重复的问题,比如下图所示的情况:
假设一下,当从位置 0 走到位置 2 之后,其代码应该如下:
|
|
但是当路径如下图所示,两个位置存在环的情况时,就会一直在递归里面。
那么,有没有什么办法可以处理这种回环问题呢?如果我们能够标记一下已经访问过的结点,就可以破解这个环了。
比如,当访问位置 0 之后,将其标记为“已访问”(绿色的叉),再从位置 2 遍历的时候,如果发现位置 0 已经访问过了,就不再访问。经过上述分析,代码可以更新如下:
|
|
DFS 的模板 1
到这里,我们已经得到了 DFS 的模板伪代码。这里将 opt 设置为每次可以做出的选择,代码如下:
|
|
接下来,我们尝试使用上面这个模板解决一些题目。
DFS 连通域问题
例 1:替换字母
【题目】给你一个矩阵 A,里面只包含字母 ‘O’ 和 ‘X’,如果一个 ‘O’ 上下左右四周都被 ‘X’ 包围,那么这个 ‘O’ 会被替换成 ‘X’。请你写程序处理一下这个过程。
解释:由于中心的 ‘O’ 四周都被 ‘X’ 包围,所以需要被换成 ‘X’,而第 A[0][0] = ‘O’ 靠着边,所以不能被替换。
【分析】我们曾经在“第 07 讲|并查集”中讲解过这个题目。实际上,这道题还有另外一种思路。可以演示如下:
因此,这道题目的重点就是遍历每一个边缘的点,以及与之相邻的点。如果把这个问题的求解过程看成走迷宫,那么需要稍微做出两点变动。
原始问题中的走迷宫,需要用 vis 专门记录某个点是否已经被访问过了而这道题中,我们可以直接在给定的数组上进行标记(visited)。
原始问题中的走迷宫,需要走到某个具体的位置就结束。而这道题里,我们需要遍历所有相连的结点。
【代码】到这里,就可以写出如下代码了:
|
|
代码:Java/C++/Python
复杂度分析:每当一个点被 DFS 函数访问过之后,后面的 DFS 将不会再去访问它。因此整个程序的时间复杂度为 O(N),其中 N 为点的总数。空间复杂度为递归的深度,最差情况下,递归深度可以达到 O(N) 级别(虽然深度不是 N,但是与 N 是线性函数,所以为 O(N))。
【小结】我们总结一下这道题目,在经典的 DFS 模板的基础上,用 DFS 来求解边缘上的点,以及与之相连通的点。
因此,我们就收获了 DFS 的一个应用:求解连通域。你可以和我们之前学习“第 07 讲|并查集”中求解连通域的方法进行比较。这里带你复习已学知识,同时巩固本讲介绍的新方法,我特地给你留了两道关于连通域的练习题,希望你不要偷懒,尝试求解一下。
练习题 1:给定一个黑白图像,其中白色像素用 ‘1’ 表示,黑色像素用 ‘0’ 表示。如果把上下左右相邻的白色像素看成一个连通域,给定一幅图(用矩阵表示),请问图中有几个连通域。
输入:A = [[‘1’, ‘1’, ‘0’], [‘0’, ‘1’, ‘0’]]
输出:1
解释:图中所有的 ‘1’ 都是连在一起的,所以只有一个连通域。
代码:Java/C++/Python
练习题 2:给定一个图(不是图像)的矩阵,A[i][j] = 1 表示点 i 与点 j 相连,求这个图里面连通域的数目。
输入:A = [[1,0,0],[0,1,0],[0,0,1]]
输出:3
解释:[0, 1, 2] 三个点中,每个点都不与其他点相连,所以连通域有 3 个。
代码:Java/C++/Python
DFS 最优解问题
除了求解连通域之外,还可以利用 DFS 来搜寻最优解。在一些面试题中,最终需要解决的是:
如何从所有可行解中找到最优解?
首先,我们将这些问题放宽,就退化为我们在“12 | 回溯:我把回溯总结成一个公式,回溯题一出就用它”介绍过的“回溯问题”。因此,我们需要在回溯的基础上,从所有解中,找到最优解。
DFS 的模板 2
如果题目中需要求解最优解,那么,DFS 问题就退化为回溯问题,只不过满足约束的条件就变成:“从所有解中找到最优解”。这里我再给出 DFS 的第 2 个模板。
|
|
注意,调用方的代码,在调用的时候,需要注意这样调用:
|
|
例 2:最短路径
【题目】给定一个迷宫,其中 0 表示可能通过的地方,而 1 表示墙壁。请问,从左上角走到右下角的最短路径是什么样的?请依次输出行走的点坐标。
输入:A = [[0, 1], [0, 0]]
输出:ans = [[0, 0], [1, 0], [1,1]]
解释:
【分析】最优路径如上图所示,如果两点在图中可达,那么这两个点肯定是在同一个连通域中。不难得出,这个题一定可以利用 DFS 进行求解。但是注意问题要求的是找到最优解,因此,我们还需要从所有解中找到最优解。此时就需要使用我们刚学过的 DFS 的模板 2 了。
【代码】问题本身已经非常模板化了,因此,我们可以直接写代码如下:
|
|
代码:Java/C++/Python
复杂度分析:在最差情况下,一个 N x N 的图中,如果没有任何墙,那么所有的行走路径就是一个组合问题,这里可以简单归为 O(N!),空间复杂度为 O(N)。
【小结】在这个简单的题目中,我们尝试使用 DFS + 回溯的思路来求解最优解的问题。有时候,这种一个一个遍历所有解,然后再从里面找到最优解的算法,也被叫作暴力搜索。
暴力搜索本质上与回溯的复杂度非常接近。因此,在可能的情况下,我们要尽可能地进行剪枝。所谓剪枝,就是通过一些信息,提前判断出当前这条求解路径不可能是最优解,此时就应该及时放弃这条路径。
这里我给出剪枝 1:比如,在暴力搜索的时候,我们已经遍历了很多条路径,并且更新了 ans 的情况下。如果发现,当前路径的长度已经 >= ans.size(),那么当前解肯定不能成为最优解,所以我们应该迅速返回,不要再继续寻找下去了。
经过上述分析,代码可以更新如下(代码其他部分仍然一样):
|
|
另外,我们还可以进行如下剪枝 2:虽然我们要找出到终点的最短路径,在这个过程中,可以把能走到每个位置的最少步数的情况都记录下来,当发现走到的位置的步数已经很大的时候,就可以直接返回。
经过上述分析,代码可以优化如下:
|
|
代码:Java/C++/Python
下面我们再看一个经典的国际象棋“皇后问题”。你可以通过下面这个练习题想一想,如何有效地进行剪枝吗?
练习题 3:给定一个 n x n 的棋盘,里面要放置 n 个皇后。使它们不能相互攻击。
输入:n = 4
输出:
[
[".Q..", // 解法 1
“…Q”,
“Q…”,
“..Q.”],
["..Q.", // 解法 2
“Q…”,
“…Q”,
“.Q..”]
]
解释:当棋盘为 4 x 4 的时候,只有这两种解。
代码:Java/C++/Python
练习题 4:给定一个字符串,需要把这个字符串切分为很多子串,还需满足:每个子串都是回文串。返回所有的切分方式。
输入:s = “aab”
输出: ans = [‘a’, ‘a’, ‘b’], [‘aa’, ‘b’]
代码:Java/C++/Python
DFS 记忆化搜索
关于记忆化搜索,依然从一个简单的例子讲起:斐波那契数列。我们都知道这个数列的通项公式为:
F(0) = 0, F(1) = 1, F[n] = F[n-1] + F[n-2]
现在要写一个函数求 F(x)。直接根据公式,可以得到递归代码如下(当然,我们也可以认为 DFS 是一种递归):
|
|
但是这个算法存在重复计算,导致复杂度极高。比如,如下图所示,我们发现 fib(5) 实际上是会被重复计算的。
为了减少这种重复计算,可以有两种办法:
把计算的结果存下来,后面遇到的时候,就直接返回;
使用动态规划。
在这里我们采用的方式是把计算的结果存下来。那么代码可以更新如下:
|
|
采用“把计算结果存下来”的方法,思路清晰,比较容易想到,代码也比较容易实现。因此,当你遇到有的动态规划的题目无法打开思路的时候,不妨尝试采用这种思路。
例 3:整数拆分
【题目】给定一个数组,表示钱的面额,每种面额,你都有无穷多张钱。再给定一个整数 T,你需要用最少的钞票来表示这个整数。无法表示的时候,输出 -1。
输入:A = [1, 2], T = 3
输出:2
解释:只需要1 + 2 = 3,所以最少你需要 2 张钞票。
【分析】首先,我们可以只考虑 DFS 递归的情况,代码如下:
|
|
在给定 A = [1, 2],T= 5 情况下,那么伪代码展开如下:
我们可以发现,在不断地求解的过程,总是有很多数会被重复地计算。因此,很容易想到,把一些中间的结果存下来,以便后面使用。
边界:这个题的思路本身不是特别难。但是在写代码的时候,要考虑到各种特殊情况,比如:
T 小于等于 0
DFS 返回值的设计
【代码】根据上面的分析,我们就可以写出如下代码了:
|
|
代码:Java/C++/Python
复杂度分析:当给定的数为 T 时,最大递归深度为 T,每次递归需要依次遍历数组 A 的每个元素。因此,时间复杂度为 O(TN),其中 N 为数组中元素的个数,空间复杂度为 O(T)。
【小结】在这里,每次搜索的时候,都要尽可能把相应的结果记录下来。不过在处理的细节上,有以下几点需要注意:
优先处理容易返回的路径,比如 T 小于 0,T 等于 0;
把不能求解的答案也进行了标记;
DFS 的返回值设置为 INF,在调用方再根据 DFS 的返回值决定是否返回 -1。
练习题 5:给定一个三角形的整数排列,返回从上往下的路径的最小和。
输入:triangle = [[2],[3,4],[6,5,7],[4,1,8,3]]
输出:11
请参见如下简图:
自顶向下的最小路径和为 11(即 2 + 3 + 5 + 1 = 11)
代码:Java/C++/Python
记忆化搜索是动态规划的基础。如果你发现一些题目考察的是动态规划,但却不容易求解的时候,可以尝试使用记忆化搜索来进行破解。
BFS 概述
DFS 可以帮助我们找到最优解。不过在搜索的时候,若想知道一些关于“最近/最快/最少”之类问题的答案,往往采用 BFS 更加适合。
那么,什么是 BFS?搜索时,BFS 与 DFS 又有什么不同?我们可以利用下图表示:
实际上,我们在“02 | 队列:FIFO 队列与单调队列的深挖与扩展”介绍队列时,就已经讲过了 BFS,并且介绍了 BFS 的两种方法与模板。为了方便你复习,将新知识与旧知识联系起来,我把“第 02 讲”例 1 中介绍的两种方法的代码链接放在这里,你可以再次动手敲一敲。
二叉树层次遍历解法 1 代码:Java/C++/Python二叉树层次遍历解法 2 代码:Java/C++/Python
通过把“第 02 讲”的例 1 进行一个归纳,我整理了较为通用的 BFS 的代码模板供你面试时使用,如下所示:
|
|
接下来,我们看一些可以利用 BFS 解决的面试的题目。
例 4:最短路径
【题目】给定一个矩阵,矩阵中只有 0,1,其中 0 表示可以通行的路径,1 表示墙,请返回从左上角走到右下角的最短路径。(注意:这个题里面有 8 个方向可以走,也就是可以斜着走),如果不存在这样的路径,那么返回 -1。
输入:grid = [[0,0,0],[1,1,0],[1,1,0]]
输出:4
解释:行走路线如下图所示,只需要走 4 个格子。(注意有个位置走了斜线)。
【分析】用 BFS 求解问题的时候:只需要注意一个点的选择。
对于矩阵中的某个点,由于可以斜线走,那么一共有 8 个方向,如下图所示:
那么找下一个点的时候,可以这样写代码:
|
|
这就轻松解决获取下一个点的问题。此外,我们还需要把已经访问过的点进行标记,以防止重复访问。不过,这里可以采用原地标记的方式,直接将给定的数组里面的 0 改成 1,表示已经访问过了。
【代码】再根据前面给定的模板我们可以得到如下的代码:
|
|
代码:Java/C++/Python
复杂度分析:最差情况下,每个点都需要入队出队一次,这里我们使用的是 FIFO 队列,出队入队时间复杂度为 O(1),如果有 N 个点,时间复杂度为 O(N)。最差情况下所有的点都在队列中,那么空间复杂度为 O(N)。
【小结】注意这个题与例 2 的区别在于:例 2 中,每次行走的时候只有 4 个方向,上下左右。而这道题目有 8 个方向可以行走。
这里我们发现了“最短”两个关键字,因此,决定使用 BFS 进行搜索。不过实际上,例 2 也可以使用 BFS 来搜索,而例 4 也可以使用 DFS 进行求解。
接下来,我们看另外一类 BFS 可以求解的题目。
例 5:最安全的路径
【题目】在一个无向图上,给定点个数 n,编号从 [0n],再给定边的个数 m。其中每条边由x[i], y[i], w[i] 表示。x[i], y[i] 分别表示边上两点的编号而 w[i] 表示这边条的危险系数。现在我们想找到一条路径从 0n,使得这条路径上最大危险系数最小。(注意:不是路径和最小,而是路径上的最大值最小)。
输入:n = 2, m = 2, x[] = [0, 1], y[] = [1,2], w[]=[1,2]
输出:2
解释:注意两条边的表示:边 1:(x[0]=0, y[0]=1, w[0]=1), 边 2:(x[1] = 1, y[1] =2, w[1]=2)。所以形成了下图:
形成的路径为 0 → 1 → 2,路径最大危险系数为 2,所以输出 2。
注意:后面用 <x, y, c> 表示 x 到 y 这条边上的危险系数为 c。
【分析】当我们看到“最 X"这样的词语的时候,应该条件反射地想到用 BFS。
不过,在用 BFS 的时候,我们需要先进行一个简单的模拟。
第一轮的时候,如果我们还使用 FIFO 队列。那么有走法 1:从 0 出发,走边 <0, 2, 6> 到达 2。
但实际上,还有走法 2:从结点 0 走到结点 1,再从结点 1 走到结点 2,路径为 [<0,1,1>, <1,2,2>]。
这种走法,危险系数仅为 2。
如果我们在 BFS 的时候,先遍历到走法 1,再遍历到走法 2。此时,走到结点 2 的危险系数需要更新 2 次。
那么,出现这种反复更新的情况的根本原因为:我们将更差劲的走法安排在了前面。
那么,有没有什么办法可以把更好的走法安排在前面呢?这个时候,就需要使用我们“03 | 优先级队列:堆与优先级队列,筛选最优元素”学过的数据结构了:优先级队列。
我们可以把优先级队列想象成一个袋子,每次从袋子里面拿东西的时候,总是从里面拿出优先级最高的结果。
【代码】基于这样的思路,可以写出代码如下:
|
|
代码:Java/C++/Python
复杂度分析:最差情况下,一共有 N 个点,所有的结点都需要入队,出队一次。每次出入队的时间复杂度为 O(lgN),所以整个算法的时间复杂度为 O(NlgN)。
【小结】通过这个题,我们可以发现:
路径之间,需要优先处理的情况,直接用优先级队列替换 FIFO 队列;
有重复更新的情况,使用优先级队列。
为了练习这个技巧,我再给你留了一道练习题,请你尝试自己求解一下。
练习题 6:在一个 N x N 的坐标方格 grid 中,每一个方格的值 grid[i][j] 表示在位置 (i,j) 的平台高度。现在开始下雨了。当时间为 t 时,此时雨水导致水池中任意位置的水位为 t 。你可以从一个平台游向四周相邻的任意一个平台,但是前提是此时水位必须同时淹没这两个平台。假定你可以瞬间移动无限距离,也就是默认在方格内部游动是不耗时的。当然,在你游泳的时候你必须待在坐标方格里面。你从坐标方格的左上平台 (0,0) 出发。最少耗时多久你才能到达坐标方格的右下平台 (N-1, N-1)?
代码:Java/C++/Python
总结
在本讲中,介绍了两种搜索:DFS 和 BFS。不过这里我们还没有讲遇到什么样的题目的时候,应该使用什么样的搜索?
这需要你根据不同情况,结合今天所讲的内容综合分析。最后,我凭借一些自己积累的经验,带你总结一下 DFS 和 BFS 这两种搜索的区别,
如果要像回溯似的处理每一种可能性,那么用 DFS 更加方便,也更加节省内存。因为 BFS 相当于是会存储下所有的解,在某些时候,内存占用率会比较可观。
一些开放式搜索问题,使用 BFS 则更加方便,比如:在一个无边界的二维平面上,要从某个点 Start 出发,按照一定规则走到另外一个点 End,求最小路径。由于是开放式的边界,那么使用 DFS,会一直递归下去。
条件的选择具有优先级的时候,使用 BFS + 优先级队列更加方便。
一些类似动态规划的题目,使用 DFS + 记忆化搜索更加方便。
为了方便你复习,我将本讲的知识点总结如下:
思考题
最后我再给你留一个思考题。
数字 n 代表生成括号的对数,请你设计一个函数,用于能够生成所有可能的并且有效的括号组合。
输入:n = 3
输出:["((()))","(()())","(())()","()(())","()()()"]
DP 解法:Java/C++/PythonBFS 解法 1:Java/C++/PythonBFS 解法 2:Java/C++/PythonDFS 解法:Java/C++/Python
关于 DFS 和 BFS 我们就介绍到这里,后面我们将要学习“14 | DP:我是怎么治好“DP 头痛症”的?”。让我们继续前进。
附:题目出处和代码汇总
例 1:替换字母
测试平台
代码:Java/C++/Python
练习题 1
测试平台
代码:Java/C++/Python
练习题 2
测试平台
代码:Java/C++/Python
例 2:最短路径
测试平台
代码:Java/C++/Python
练习题 3:n 皇后
测试平台
代码:Java/C++/Python
练习题 4:分割回文串
测试平台
代码:Java/C++/Python
例 3:整数拆分
测试平台
代码:Java/C++/Python
练习题 5:最小路径和
测试平台
代码:Java/C++/Pytho
例 4:最短路径
测试平台
代码:Java/C++/Python
例 5:最安全的路径
测试平台
代码:Java/C++/Python
练习题 6:水位线
测试平台
代码:Java/C++/Python
思考题
测试平台
DP 解法:Java/C++/PythonBFS 解法 1:Java/C++/PythonBFS 解法 2:Java/C++/PythonDFS 解法:Java/C++/Python
-– ### 精选评论 ##### **威: > 老师水平真高,讲课信手拈来~ ##### **福: > vis[begin] = true; // !注意设置初始点为已访问begin.append(begin); // ! 注意把begin放到path中。dfs(A, vis, begin, ans)return ans;begin.append (begin)应该是笔误 ###### 讲师回复: > 确实笔误,代码已经更正!
文章作者
上次更新 10100-01-10