LeetCode 10. 正则表达式匹配 | Python（leetcode积分有什么用）-APISpace

LeetCode 10. 正则表达式匹配 | Python（leetcode积分有什么用）

10. 正则表达式匹配

题目来源：https://leetcode-cn.com/problems/regular-expression-matching

题目

给你一个字符串 s 和一个字符规律 p，请你来实现一个支持 '.' 和 '*' 的正则表达式匹配。

'.' 匹配任意单个字符

'*' 匹配零个或多个前面的那一个元素

所谓匹配，是要涵盖整个字符串 s的，而不是部分字符串。

说明:

s 可能为空，且只包含从 a-z 的小写字母。

p 可能为空，且只包含从 a-z 的小写字母，以及字符 . 和 *。

示例 1:

输入:

s = "aa"

p = "a"

输出: false

解释: "a" 无法匹配 "aa" 整个字符串。

示例 2:

输入:

s = "aa"

p = "a*"

输出: true

解释: 因为 '*' 代表可以匹配零个或多个前面的那一个元素, 在这里前面的元素就是 'a'。因此，字符串 "aa" 可被视为 'a' 重复了一次。

示例 3:

输入:

s = "ab"

p = ".*"

输出: true

解释: ".*" 表示可匹配零个或多个（'*'）任意字符（'.'）。

示例 4:

输入:

s = "aab"

p = "c*a*b"

输出: true

解释: 因为 '*' 表示零个或多个，这里 'c' 为 0 个, 'a' 被重复一次。因此可以匹配字符串 "aab"。

示例 5:

输入:

s = "mississippi"

p = "mis*is*p*."

输出: false

解题思路

暴力解

先从【暴力解】的角度理清问题。

这个题目中，难点就在于处理 . 和 * 两个符号。

如果只是要求检查两个普通字符是否匹配。那么通过直接遍历，检查每个数组对应的元素是否相同来判断是否匹配即可。例如：

def isMatch(s, p):

if len(s) != len(p):

return False

for i in range(p):

if s[i] != p[i]:

return False

return True

那代码大概就会是这样。那我们用递归的形式来书写，以下为伪代码：

def isMatch(s, p):

"""

s: text

p: pattern

"""

if p is empty:

return s is empty

first_match = (s not empty) and p[0] == s[0]

return first_match and isMatch(s[1:], p[1:])

在上面的代码中，其实就是通过先判断前面的元素是否匹配，逐层往下判断后面的元素是否也匹配，从而来找到答案。

现在来处理两个符号的问题，. 这个符号，表示的是匹配处换行符以外的任意字符（这里就不展开说明了，若需详细了解，可直接上网搜索）。

了解这个符号的含义后，这里所能表达的意义，也会相应的改变，即是说，当 p 中出现 . 号，s 对应的元素无论是什么字符（题目说明 s 仅包含 a-z 字符）都能够匹配，现在根据上面的伪代码进行修改：

def isMatch(s, p):

"""

s: text

p: pattern

"""

if not p:

return not s

first_match = bool(s) and p[0] in {s[0], '.'}

return first_match and isMatch(s[1:], p[1:])

这里唯一不同的就是 first_match 这部分的判断中，因为 p 中的元素可能出现固定字符，或者 . 号，所以当 p 出现的字符与 s 中对应的字符相同，或者 p 此处是 . 字符，这里两者都表示能够匹配。

那么现在往下看 * 符号，这个符号表示的含义是重复零次或多次。那么这里最明显的字符就是重复多少次的问题？在这里考虑使用递归的方式书写，假设重复 n 次，其实这里先不需要考虑 n 是多少，把这个交给递归实现。要考虑那么当下的情况，这里应该就只有两个选择，要么是匹配 0 次，要么是匹配 1 次。

那么相应的代码就应该修改为（这里书写发现 * 的情况）：

# 这里表示发现 `*` 的情况下，

if len(p) >= 2 and p[1] == '*':

# 这里需要考虑匹配 0 次的问题，例如 aa，c*aa

# 也要考虑匹配多次的问题，例如 aa, a*

return isMatch(s, p[2:]) or first_match and isMatch(s[1:], p)

在这段代码当中，isMatch(s, p[2:]) 这里表示，字符匹配 0 次，跳过 p 中字符与 * 结合这部分。后面的表示，p[0] 和 s[0] 匹配之后，继续判断 s 接下来的元素。其中保留 p，只向后移动 s，是为了实现 * 匹配多次的功能。

这样来看，其实已经可以说理清两个符号的具体实现方式。

关于完整的代码请查看【代码实现】部分。

动态规划

思路：动态规划

在上面暴力解的方法中，频繁使用切片操作，复杂度高。这里在暴力解的基础上，使用动态规划的方法，定义变量 i，j 来记录当前匹配到的位置，用 dp(i, j) 表示 s[i:] 和 p[j:] 是否能够匹配。，避免频繁切片。这里也引入备忘录的概念，用来避免重复的运算。

具体代码同样请查看【代码实现】部分。

代码实现

暴力解 | 代码实现

class Solution:

def isMatch(self, s: str, p: str) -> bool:

if not p:

return not s

first_match = bool(s) and p[0] in {s[0], '.'}

if len(p) >= 2 and p[1]=="*":

return self.isMatch(s, p[2:]) or first_match and self.isMatch(s[1:], p)

else:

return first_match and self.isMatch(s[1:], p[1:])

动态规划 | 代码实现

class Solution:

def isMatch(self, s: str, p: str) -> bool:

memo = {}

def dp(i, j):

if (i, j) not in memo:

if j == len(p):

return i == len(s)

else:

first_match = i < len(s) and p[j] in {s[i], '.'}

if j + 1 < len(p) and p[j+1] == '*':

ans = dp(i, j+2) or first_match and dp(i+1, j)

else:

ans = first_match and dp(i+1, j+1)

memo[(i, j)] = ans

return memo[(i, j)]

return dp(0, 0)

实现结果

暴力解 | 实现结果

动态规划 | 实现结果

Python中删除空白字符（python 去掉空白字符）

300 2022-08-20

LeetCode 10. 正则表达式匹配 | Python（leetcode积分有什么用）

python经典算法题：无重复字符的最长子串（不含有重复字符的最长子串 Python）

Python中删除空白字符（python 去掉空白字符）

Python Re 模块超全解读！（python中range()函数的用法）

推荐文章

api接口有哪几种分类及功能

什么是API接口?API接口简单介绍

短信API接口概述，短信API接口的优势

7款快递物流的物流查询API工具，物流快递查询API接口怎么对接？

企业四要素: 了解企业经营成功的关键

什么是语音验证码?,语音验证码平台有哪些

全国工商查询系统怎么查企业名录

哪些平台提供实名认证的接口？

PHP如何调用API接口?

如何使用百度天气预报API接口?

最近发表

热评文章

数据接口api（数据接口API开发平台）

数据开放接口api（数据服务api开发）

Python爬虫教程：爬取酷狗音乐（python爬取

hbuilder怎么更改字体大小和颜色

直播平台api接口 - 构建卓越的直播平台

实时股票数据api接口（股票实时行情api接口）