一种可压缩内存的敏感词快速查找方法及系统

基本信息

申请号 CN202111038921.3 申请日 -
公开(公告)号 CN113778678A 公开(公告)日 2021-12-10
申请公布号 CN113778678A 申请公布日 2021-12-10
分类号 G06F9/50(2006.01)I 分类 计算;推算;计数;
发明人 陈建华 申请(专利权)人 天翼爱动漫文化传媒有限公司
代理机构 福州元创专利商标代理有限公司 代理人 张灯灿;蔡学俊
地址 361008福建省厦门市思明区软件园二期望海路6号301
法律状态 -

摘要

摘要 本发明涉及一种可压缩内存的敏感词快速查找方法及系统,该方法对敏感词库中敏感词键值进行数字化取模,以重复使用B+树节点,减少B+树节点数量,进而减少内存的占用,然后基于数字化键值创建敏感词库B+树节点,在B+树节点的链表中存储敏感词每个字符取模后键值一样的敏感词组,建立敏感词库B+树;对于待查询短文,对短文信息进行数字化取模,然后通过数字化键值查询敏感词B+树的节点,在查询到节点后再通过链表与敏感词进行比较,最终确定待查询短文中是否包含敏感词。该方法及系统有利于对敏感词进行快速查询,同时减少内存的使用。