快速过滤文本的方法、系统、电子装置和存储介质
基本信息
申请号 | CN202110236399.3 | 申请日 | - |
公开(公告)号 | CN113094493A | 公开(公告)日 | 2021-07-09 |
申请公布号 | CN113094493A | 申请公布日 | 2021-07-09 |
分类号 | G06F16/335(2019.01)I | 分类 | 计算;推算;计数; |
发明人 | 童毅 | 申请(专利权)人 | 杭州电魂网络科技股份有限公司 |
代理机构 | 杭州创智卓英知识产权代理事务所(普通合伙) | 代理人 | 张超 |
地址 | 310051浙江省杭州市滨江区西兴街道滨安路435号 | ||
法律状态 | - |
摘要
摘要 | 本申请涉及一种快速过滤文本的方法、系统、电子装置和存储介质,其中,该快速过滤文本的方法包括:配置特殊符号过滤规则,并加载黑名单的文本词汇生成黑名单拓扑树,加载白名单的文本词汇生成白名单拓扑树;接着根据特殊符号过滤规则,生成去除特殊符号的待过滤文本,并记录特殊符号信息;然后通过黑名单拓扑树匹配和白名单拓扑树匹配,过滤待过滤文本,得到过滤文本;最后将记录的特殊符号信息还原到过滤文本中,并输出最终的过滤文本。通过本申请,解决了在对网络文本进行过滤时,存在的内存资源占用大、效率不高和过滤不完全的问题,提高了文本过滤的效率和用户体验感。 |
