一种敏感词匹配方法、装置、计算机设备和存储介质
基本信息
申请号 | CN201911177984.X | 申请日 | - |
公开(公告)号 | CN112861526A | 公开(公告)日 | 2021-05-28 |
申请公布号 | CN112861526A | 申请公布日 | 2021-05-28 |
分类号 | G06F40/279(2020.01)I;G06F16/33(2019.01)I | 分类 | 计算;推算;计数; |
发明人 | 张生林 | 申请(专利权)人 | 上海鱼泡泡信息科技有限公司 |
代理机构 | - | 代理人 | - |
地址 | 201600上海市漕河泾开发区松江高科技园莘砖公路668号202室-279 | ||
法律状态 | - |
摘要
摘要 | 本发明适用于计算机技术领域,具体是一种敏感词匹配方法、装置、计算机设备和存储介质,其中敏感词匹配方法包括:获取待检测的文本;确定当前检测字符;基于敏感词匹配树判断当前检测字符是否与敏感词关联,其中敏感词匹配树是预先通过至少一个敏感词或近似敏感词训练生成,近似敏感词是指敏感词中至少有一个字是被该字的拼音、拆分字或同源字所代替;输出所述预设的敏感词。本发明实施例提供一种敏感词匹配方法,由于预设的敏感词匹配树是预先通过至少一个近似敏感词训练生成,因此在使用敏感词匹配树对文本进行敏感词匹配的过程中能够有效地对变形的敏感词进行检测,提高了对变形敏感词的检测效果。 |
