基于保序子矩阵和频繁序列挖掘的电商评论情感分类方法

基本信息

申请号 CN201710481733.5 申请日 -
公开(公告)号 CN107357837B 公开(公告)日 2019-10-08
申请公布号 CN107357837B 申请公布日 2019-10-08
分类号 G06F16/33;G06F17/27;G06Q30/02 分类 计算;推算;计数;
发明人 黄佳锋;马志豪;陈鑫;卢昕;薛云;胡晓晖 申请(专利权)人 苏州高航知识产权运营有限公司
代理机构 广州粤高专利商标代理有限公司 代理人 华南师范大学
地址 510631 广东省广州市天河区中山大道西55号
法律状态 -

摘要

摘要 本发明公开了基于保序子矩阵和频繁序列挖掘的电商评论情感分类方法,包括步骤:(1)对电商评论进行预处理和中文分词,计算得到近义词的TF‑IDF权重向量,然后基于保序子矩阵OPSM双聚类算法挖掘出权重向量中的局部模式;(3)使用改进的PrefixSpan算法挖掘分类频繁短语特征,同时也通过词语间隔等限制来提升频繁短语区分情感倾向的能力;(4)将(2)和(3)步骤挖掘出来的特征转化成0/1向量,作为分类器的输入,最终得到电商评论的情感分类结果。本发明能够准确地挖掘出电商评论的情感分类特征,使潜在消费者在购买商品前了解商品的评价信息,也能使商家更加充分地了解消费者的意见,从而提高服务质量。