一种可压缩内存的敏感词快速查找方法及系统
基本信息
申请号 | CN202111038921.3 | 申请日 | - |
公开(公告)号 | CN113778678A | 公开(公告)日 | 2021-12-10 |
申请公布号 | CN113778678A | 申请公布日 | 2021-12-10 |
分类号 | G06F9/50(2006.01)I | 分类 | 计算;推算;计数; |
发明人 | 陈建华 | 申请(专利权)人 | 天翼爱动漫文化传媒有限公司 |
代理机构 | 福州元创专利商标代理有限公司 | 代理人 | 张灯灿;蔡学俊 |
地址 | 361008福建省厦门市思明区软件园二期望海路6号301 | ||
法律状态 | - |
摘要
摘要 | 本发明涉及一种可压缩内存的敏感词快速查找方法及系统,该方法对敏感词库中敏感词键值进行数字化取模,以重复使用B+树节点,减少B+树节点数量,进而减少内存的占用,然后基于数字化键值创建敏感词库B+树节点,在B+树节点的链表中存储敏感词每个字符取模后键值一样的敏感词组,建立敏感词库B+树;对于待查询短文,对短文信息进行数字化取模,然后通过数字化键值查询敏感词B+树的节点,在查询到节点后再通过链表与敏感词进行比较,最终确定待查询短文中是否包含敏感词。该方法及系统有利于对敏感词进行快速查询,同时减少内存的使用。 |
