一种基于多特征集成学习的文本情感分类方法

基本信息

申请号 CN201811335524.0 申请日 -
公开(公告)号 CN109492105A 公开(公告)日 2019-03-19
申请公布号 CN109492105A 申请公布日 2019-03-19
分类号 G06F16/35(2019.01)I; G06F17/27(2006.01)I; G06K9/62(2006.01)I 分类 计算;推算;计数;
发明人 陈福; 陈小波 申请(专利权)人 上海文军信息技术有限公司
代理机构 - 代理人 -
地址 201100 上海市闵行区中春路4999号1449室
法律状态 -

摘要

摘要 本发明公开了一种基于多特征集成学习的文本情感分类方法。本方法为:文本预处理。构造词语词典和情感词典。文本在每种词典上的向量化表示。训练基分类器:在每种文本向量化表示的基础上训练分类器。最后将基分类器集成,通过多个基分类器的线性组合来决定预测文本情感的最终分类。本发明具有以下优点:通过设计词语词典和情感词典,在两个互补的特征空间对文本进行表示,可以提取文本中更丰富的情感特征。同时,集成学习可以将不同特征空间中的情感鉴别结果进行融合,提高了文本情感分类的准确度。