一种垃圾文本识别方法和装置

基本信息

申请号 CN201710273503.X 申请日 -
公开(公告)号 CN107239440B 公开(公告)日 2021-05-25
申请公布号 CN107239440B 申请公布日 2021-05-25
分类号 G06F40/279(2020.01)I;G06F16/9535(2019.01)I;G06F40/30(2020.01)I;G06F40/289(2020.01)I 分类 -
发明人 斯义谱;郑侃侃 申请(专利权)人 杭州博盾习言科技有限公司
代理机构 北京润泽恒知识产权代理有限公司 代理人 苏培华
地址 310000 浙江省杭州市余杭区五常街道文一西路998号18幢704室
法律状态 -

摘要

摘要 本发明实施例提供了一种垃圾文本识别方法和系统,该方法和系统应用于互联网,具体为获取互联网的用户输入的文本;对文本的特征进行特征提取,得到文本的多个文本特征;利用预设的垃圾文本识别模型对用户输入的文本进行识别,得到文本的垃圾概率。通过用户输入的文本的垃圾概率和一定的预设标准可以确定出该文本是否为垃圾文本,并可进一步对判定的垃圾文本采取一定的预防措施,从而能够避免垃圾文本对互联网的健康发展带来不利影响。