KMP数组! | Panda_Clog

💎KMP数组!

字数 1195阅读时长≈ 3 分钟

2024-10-23

type

status

date

slug

summary

tags

category

icon

password

🤨

一个人能走多远不取决于在顺境时能走多远，而取决于在逆境时多久能找回曾经的自己 — KMP

📝 KMP数组

我习惯于把KMP算法中用于判断匹配过的字符串的Next数组(部分匹配表)称之为KMP数组,今天我们具体来看看KMP数组的实现过程 → 最长公共前后缀长度

KMP算法的基本思想

利用已有的匹配信息：

当在主字符串中进行匹配时，如果遇到不匹配的字符，KMP算法不会简单地将模式字符串向右移动一位重新开始匹配。而是利用之前已经匹配过的部分，根据部分匹配表（前缀函数）的信息，确定下一个可能的匹配位置，从而减少比较次数。

前缀函数（部分匹配表）：

前缀函数用于记录模式字符串中每个位置之前（不包括当前位置）的最长相等的真前缀和真后缀的长度。

通过前缀函数，KMP算法能够知道在发生不匹配时，模式字符串应该向右移动多少位，以便继续进行有效的匹配。

🤗 实现过程

先看看代码吧

初始化：

pos = 0：表示当前没有任何前缀和后缀匹配。

通常，kmp 数组会初始化为全零数组，表示所有位置初始的最长前缀后缀长度为0。

遍历模式串：

for i in range(2, n + 1)：从模式串的第2个字符开始遍历到第n个字符。这里假设字符串索引从1开始。

每次迭代，i 表示当前正在处理的字符位置。

处理当前位置的字符：

比较当前字符与前缀字符：

s[pos + 1]：当前前缀的下一个字符，即尝试扩展前缀。
s[i]：当前处理的位置字符。

处理不匹配情况：

while pos and s[pos + 1] != s[i]：

当 pos > 0 且当前字符不匹配前缀的下一个字符时，需要回退到前缀的最长前缀后缀位置，避免重复比较。
pos = kmp[pos]：将 pos 更新为前缀的最长前缀后缀长度，即跳转到 kmp[pos]。

处理匹配情况：

if s[pos + 1] == s[i]：

如果当前字符与前缀的下一个字符匹配，则可以扩展当前的前缀后缀长度。
pos += 1：增加前缀后缀的长度。
kmp[i] = pos：记录当前 i 位置的最长前缀后缀长度。

四、示例解析

让我们通过一个具体的示例来理解这段代码的工作原理。

示例模式串：s = "ABABCABAB"

假设字符串索引从1开始：

索引	1	2	3	4	5	6	7	8	9
字符	A	B	A	B	C	A	B	A	B

部分匹配表预期结果：

i	1	2	3	4	5	6	7	8	9
π[i]	0	0	1	2	0	1	2	3	4

构建过程：

初始化：

pos = 0

kmp = [0] * (n + 1) → kmp = [0, 0, 0, 0, 0, 0, 0, 0, 0, 0]

i = 2：

比较 s[1] (A) 和 s[2] (B) → 不匹配。

pos = 0

kmp[2] = 0

i = 3：

比较 s[1] (A) 和 s[3] (A) → 匹配。

pos = 0 + 1 = 1

kmp[3] = 1

i = 4：

比较 s[2] (B) 和 s[4] (B) → 匹配。

pos = 1 + 1 = 2

kmp[4] = 2

i = 5：

比较 s[3] (A) 和 s[5] (C) → 不匹配。

回退：pos = kmp[2] = 0

比较 s[1] (A) 和 s[5] (C) → 不匹配。

kmp[5] = 0

i = 6：

比较 s[1] (A) 和 s[6] (A) → 匹配。 → s[1]回到开头了

pos = 0 + 1 = 1

kmp[6] = 1

i = 7：

比较 s[2] (B) 和 s[7] (B) → 匹配。

pos = 1 + 1 = 2

kmp[7] = 2

i = 8：

比较 s[3] (A) 和 s[8] (A) → 匹配。

pos = 2 + 1 = 3

kmp[8] = 3

i = 9：

比较 s[4] (B) 和 s[9] (B) → 匹配。

pos = 3 + 1 = 4

kmp[9] = 4

最终，kmp 数组为 [0, 0, 0, 1, 2, 0, 1, 2, 3, 4]，这正是我们预期的部分匹配表。

具体的我做了一个图：(美术功底有限)

notion image

📎 参考文章

https://oi-wiki.org/string/kmp/

💡

PanDa欢迎您在底部评论区留言，一起交流~

Python 的数据类型

<每日AC>-洛谷P2251 质量检测

<每日AC>-洛谷P2251 质量检测

作者:PanDa
链接:Panda_Clog | 代码Vlog (c.pandaclog.xyz)/article/1260312b-e533-80c8-8535-c3fe806d41e8
声明:本文采用 CC BY-NC-SA 4.0 许可协议，转载请注明出处。

相关文章

线段树—从建树到懒标记

Lazy loaded image

算法总复习

Lazy loaded image

基于《CSAPP》的计算机组成原理内容回顾

Lazy loaded image

<每日AC>-洛谷P2251 质量检测

Lazy loaded image

<每日一题>洛谷-P1563 [NOIP2016 提高组] 玩具谜题

Lazy loaded image

<Python> 快速排序

Lazy loaded image

评论

Loading...

目录

你好！我是

PanDa

🎉一个热爱分享的Coder🎉

👌日语N2👌

👌英语CET-4👌

🤯蓝桥杯Python-B组省一🤯

💪和大家一起进步💪

—🌹期待与你相遇 —