一种基于多特征集成学习的文本情感分类方法
基本信息
申请号 | CN201811335524.0 | 申请日 | - |
公开(公告)号 | CN109492105A | 公开(公告)日 | 2019-03-19 |
申请公布号 | CN109492105A | 申请公布日 | 2019-03-19 |
分类号 | G06F16/35(2019.01)I; G06F17/27(2006.01)I; G06K9/62(2006.01)I | 分类 | 计算;推算;计数; |
发明人 | 陈福; 陈小波 | 申请(专利权)人 | 上海文军信息技术有限公司 |
代理机构 | - | 代理人 | - |
地址 | 201100 上海市闵行区中春路4999号1449室 | ||
法律状态 | - |
摘要
摘要 | 本发明公开了一种基于多特征集成学习的文本情感分类方法。本方法为:文本预处理。构造词语词典和情感词典。文本在每种词典上的向量化表示。训练基分类器:在每种文本向量化表示的基础上训练分类器。最后将基分类器集成,通过多个基分类器的线性组合来决定预测文本情感的最终分类。本发明具有以下优点:通过设计词语词典和情感词典,在两个互补的特征空间对文本进行表示,可以提取文本中更丰富的情感特征。同时,集成学习可以将不同特征空间中的情感鉴别结果进行融合,提高了文本情感分类的准确度。 |
