一种多模式字符串匹配方法和装置

基本信息

申请号 CN201610017565.X 申请日 -
公开(公告)号 CN106959962B 公开(公告)日 2019-10-15
申请公布号 CN106959962B 申请公布日 2019-10-15
分类号 G06F16/903 分类 计算;推算;计数;
发明人 王树栋;王明昭;汪龙;池润清 申请(专利权)人 中国移动通信集团青海有限公司
代理机构 北京同达信恒知识产权代理有限公司 代理人 郭润湘
地址 810007 青海省西宁市经济技术开发区昆仑东路48号
法律状态 -

摘要

摘要 本发明公开了一种多模式字符串匹配方法和装置,用以提高多模式字符串匹配的匹配效率和匹配速度。所述方法中,将模式串中具有前缀包含关系的模式串压缩到一个模式串中得到压缩模式集;根据压缩模式集构造前缀集;并根据预设算法为前缀集构造AC自动机;包括:针对待匹配的文本串,将当前滑动窗口所包含的字符依次输入AC自动机中得到至少一个初次匹配位置;针对每一初次匹配位置,如果其匹配的字符串长度小于预设长度,则将其和匹配的字符串添加至匹配结果集中;如果其匹配的字符串长度等于预设长度,则将该其加入到二次匹配入口集合中;针对每一入口位置分别进行二次匹配,并将进行二次匹配的入口位置和匹配的字符串添加至匹配结果集中。