一种基于内容的恐怖文本识别方法

基本信息

申请号 CN201410171360.8 申请日 -
公开(公告)号 CN103942191A 公开(公告)日 2014-07-23
申请公布号 CN103942191A 申请公布日 2014-07-23
分类号 G06F17/27(2006.01)I 分类 计算;推算;计数;
发明人 胡卫明;刘国旗;李兵 申请(专利权)人 人民中科(山东)智能技术有限公司
代理机构 中科专利商标代理有限责任公司 代理人 宋焰琴
地址 100190 北京市海淀区中关村东路95号
法律状态 -

摘要

摘要 本发明公开了一种基于内容的恐怖文本识别方法,该方法包括:首先,对需要识别的文本进行预处理,以消除错误数据和冗余数据对识别结果的消极影响;其次,构建基于内容的文本分类器模型,该模型能够分别利用文本标题分类器和文本内容分类器对文本标题和文本内容进行独立识别,然后将两种识别结果进行决策融合,最终得出识别结果;最后,将格式化后的待识别文本数据作为基于文本分类器模型的输入,该模型的输出即为文本的识别结果。该方法在实验数据库上能够取得良好的实验效果,其识别结果具有较高的可靠性和稳定性。