KMP算法讲解
2018-06-17 21:24:30来源:未知 阅读 ()
老规矩,讲算法前,先说一道小问题吧
给你一个长串和短串,求短串在长串中出现的次数和位置。
设长串长度为len1,短串长度为len2。
如果len1*len2<=108,那就很简单了,直接暴力枚举以每个字符为开始的字符串是否匹配即可,复杂度为O(len1*len2);(是不是感觉太大了?)
如果将数据范围扩大到len1,len2<-106呢?
现在就开始介绍我们的KMP算法。
有了前面的问题,KMP要解决的是什么就自然出来了,KMP的复杂度达到的耸人听问的O(len1+len2)。
我们可以想想我们相对于暴力算法需要改进什么?
我们可以每一次失配(也就是匹配失败)的时候,不用每一次都从上一次的出发点只往后移动一个字符,可以跳啊!
我们可以预处理出每一次跳的位置来有利于节省复杂度啊。
这里我们就讲一讲怎么跳,以及怎么进行预处理。
1.怎么跳?
我们假设字符串为abaaba
我们如果在第二个a时失配了,我们应该怎么往前呢?
我们就可以可以把第一个a放在这一个位置继续匹配。
那么,如果是第四个a呢?
我们是不是就可以把第二个a放在这个位置呢?
大家可以看到,第最后一个字符到第三个a的字符串是aba,而第一个字符到第二个a的字符串是不是也是aba,它们不是一样的吗?
讲到这里,大家应该大概的明白了KMP是怎么跳的了吧。
我们记一个nxt数组,nxt[i]表示的是从第一个字符到第i个字符的最长前后缀的长度。看不懂没关系,举个例子。
假设字符串为abaaba
nxt[0]=0
nxt[1]=0(ab无前后缀)
nxt[2]=1(aba最长前后缀为a)
nxt[3]=1(abaa-----a)
nxt[4]=0(abaab--无)
nxt[5]=3(abaaba-aba)
2.初始化
问题来了,怎么用很少的时间复杂度来进行初始化呢?
很容易想到递推,怎么递推呢?
我们假设求出了前面的nxt,现在多了一个,我们就应该找一找了。
我们可以跳前一个位置的nxt,直到跳到一个位置后面有一个字符是所需要的,是那里的后面那一个字符。
每个这样递推就好了!
而查找的过程与初始化的过程类似,这里就不再赘述了。
下面上一份模板代码
1 #include<iostream> 2 #include<cstdio> 3 #include<cstring> 4 using namespace std; 5 char s1[1000010],s2[1000100]; 6 int nxt[1000100]; 7 int main() 8 { 9 scanf("%s",s1); 10 scanf("%s",s2); 11 nxt[0]=0; 12 int len1=strlen(s1); 13 int len2=strlen(s2); 14 for(int i=1,k=0;i<len2;i++) 15 { 16 k=nxt[i-1]; 17 while(k>0&&s2[k]!=s2[i]) k=nxt[k-1]; 18 if(s2[k]==s2[i]) k++; 19 nxt[i]=k; 20 } 21 for(int i=0,j=0;i<len1;i++) 22 { 23 while(j!=0&&s1[i]!=s2[j]) j=nxt[j-1]; 24 if(s1[i]==s2[j]) j++; 25 if(j==len2) 26 { 27 printf("%d\n",i-j+2); 28 } 29 } 30 for(int i=0;i<len2;i++) printf("%d ",nxt[i]); 31 return 0; 32 }
模板题:https://www.luogu.org/problemnew/show/3375
感谢大家的支持!
如果有不足之处,请尽管提出,本人不胜感激!
标签:
版权申明:本站文章部分自网络,如有侵权,请联系:west999com@outlook.com
特别注意:本站所有转载文章言论不代表本站观点,本站所提供的摄影照片,插画,设计作品,如需使用,请与原作者联系,版权归原作者所有
- C++ rand函数 2020-06-10
- OpenCV开发笔记(五十九):红胖子8分钟带你深入了解分水岭 2020-05-24
- 类欧几里得算法 2020-05-16
- 算法笔记刷题6 ( PAT 1003我要通过 ) 2020-05-08
- 无法正确通过算法题目都是哪些原因造成的? 2020-04-05
IDC资讯: 主机资讯 注册资讯 托管资讯 vps资讯 网站建设
网站运营: 建站经验 策划盈利 搜索优化 网站推广 免费资源
网络编程: Asp.Net编程 Asp编程 Php编程 Xml编程 Access Mssql Mysql 其它
服务器技术: Web服务器 Ftp服务器 Mail服务器 Dns服务器 安全防护
软件技巧: 其它软件 Word Excel Powerpoint Ghost Vista QQ空间 QQ FlashGet 迅雷
网页制作: FrontPages Dreamweaver Javascript css photoshop fireworks Flash