识别敏感文本的方法、装置、设备及可读存储介质专利查询专利号|摘要-满商公司网

识别敏感文本的方法、装置、设备及可读存储介质

基本信息

摘要

摘要	本发明公开了一种识别敏感文本的方法、装置、设备及可读存储介质，方法包括：基于待识别文本中各个词的词性，确定待识别文本的词性序列，然后根据已发布的历史文本，计算上述词性序列出现的概率，当该词性序列出现的概率小于预设阈值时，确定待识别文本为敏感文本。相较于现有技术而言，本发明实施例通过计算待识别文本的词性序列出现的概率，来确定待识别文本是否为敏感文本，由于不符合语法规定且不常见的文本，其对应的词性序列出现的概率也会较低，因此，当待识别文本的词性序列出现的概率小于预设阈值时，则可以确定待识别文本不符合语法规则且不常见，属于敏感文本。