一种多层次自然语言反垃圾文本方法及系统
基本信息
申请号 | CN201910266548.3 | 申请日 | - |
公开(公告)号 | CN109977416A | 公开(公告)日 | 2019-07-05 |
申请公布号 | CN109977416A | 申请公布日 | 2019-07-05 |
分类号 | G06F17/27(2006.01)I; G06F16/33(2019.01)I; G06F16/35(2019.01)I; G06F16/903(2019.01)I | 分类 | 计算;推算;计数; |
发明人 | 叶志豪; 刘冶; 桂进军; 李宏浩; 印鉴 | 申请(专利权)人 | 广州赫炎大数据科技有限公司 |
代理机构 | 广州骏思知识产权代理有限公司 | 代理人 | 中山大学; 广州赫炎大数据科技有限公司 |
地址 | 510275 广东省广州市海珠区新港西路135号 | ||
法律状态 | - |
摘要
摘要 | 本发明涉及一种多层次自然语言反垃圾文本方法及系统,通过获得待识别文本的敏感词识别结果、敏感词变形体识别结果,并结合对待识别文本进行文本分类得到其为垃圾文本的预判概率,基于对所述敏感词识别结果、敏感词变形体识别结果和预判概率进行综合评判,得出所述待识别文本为垃圾文本的最终概率。本发明能高效地识别垃圾文本,能避免垃圾文本对互联网健康交流环境的不利影响,有较高的稳健性,可广泛地适用于社交、评论等互联网产品。 |
