基于集成学习框架的中文网络评论情感分类方法

基本信息

申请号 CN201710713966.3 申请日 -
公开(公告)号 CN107491531B 公开(公告)日 2019-05-17
申请公布号 CN107491531B 申请公布日 2019-05-17
分类号 G06F16/953;G06F16/35;G06F17/27 分类 计算;推算;计数;
发明人 黄佳锋;黄英仁;卢昕;刘志煌;薛云;蔡倩华 申请(专利权)人 上海高航知识产权服务有限公司
代理机构 广州粤高专利商标代理有限公司 代理人 江裕强
地址 510275 广东省广州市天河区石牌华南师范大学科技处
法律状态 -

摘要

摘要 本发明公开了一种基于集成学习框架的中文网络评论情感分类方法。本发明采用词性组合模式、保序子矩阵模式和频繁词序列模式作为输入特征,在特征层面上考虑中文语序信息、间隔词组特征以及句子长度大小的影响等因素,并且利用语义相似度克服了特征向量稀疏问题;解决了评论文本特征繁多的问题,保证基分类器间独立性的同时,尽量提高基分类器的分类性能;采用基于产品属性构造基分类器算法综合评论文本中每个属性的情感信息,进而判别评论的句子级情感倾向,使得最终的分类结果更加精确。本发明适用于各种领域的电商网络评论情感分类,可以使潜在消费者在购买前了解商品的评价信息,也可以使商家更加充分地了解消费者的意见,从而提高服务质量。