一种降低敏感词谐音匹配误警率的文本审核装置及方法

基本信息

申请号 CN202011336483.4 申请日 -
公开(公告)号 CN112434523A 公开(公告)日 2021-03-02
申请公布号 CN112434523A 申请公布日 2021-03-02
分类号 G06F40/284(2020.01)I;G06F40/30(2020.01)I;G06F40/253(2020.01)I;G06F16/33(2019.01)I 分类 计算;推算;计数;
发明人 王晓平 申请(专利权)人 上海极链科技发展集团有限公司
代理机构 上海硕力知识产权代理事务所(普通合伙) 代理人 林晓青
地址 202150上海市崇明区中兴镇汲浜公路39号21号楼1103室
法律状态 -

摘要

摘要 本发明公开了一种降低敏感词谐音匹配误警率的文本审核装置及方法,该装置包括:特定词语单元替换模块,对包含敏感谐音词的待审核文本,将其敏感谐音词替换为敏感词原型,得到替换后的替换文本;分词模块,对待审核文本及替换文本进行中文分词处理,分别输出分词单元位置索引列表;语法单元一致性审核模块,根据待审核文本及替换文本的分词单元位置索引列表,进行替换前后的语法单元一致性审核;词性标注模块,对具有语法单元一致性的待审核文本及替换文本分别进行词性标注处理;词性标注一致性审核模块,对词性标注结果,比较特定词语单元替换前后的词语词性;审核结果判断输出模块,根据词性标注一致性审核模块的审核结果进行相应的判断处理。