一种融合显性和隐性特征的中文微博情感分析方法

基本信息

申请号 CN201410723617.6 申请日 -
公开(公告)号 CN104516947A 公开(公告)日 2015-04-15
申请公布号 CN104516947A 申请公布日 2015-04-15
分类号 G06F17/30(2006.01)I 分类 计算;推算;计数;
发明人 陈铁明;缪茹一 申请(专利权)人 杭州零零柒科技有限公司
代理机构 杭州斯可睿专利事务所有限公司 代理人 王利强
地址 310000 浙江省杭州市西湖区西溪新天地商业中心(公元里)11幢5层501室
法律状态 -

摘要

摘要 一种融合显性和隐性特征的中文微博情感分析方法,包括以下步骤:1)微博显性特征处理,1.1)表情符号处理;1.2)情感词处理;2)微博隐性特征处理:基于频繁项集创建初始情感簇,每个初始情感簇文本都含有频繁项集,采用知网的中文语义相似度模型,根据最大语义隶属度原则分离各个初始情感簇;最后,通过定义簇间语义相似度矩阵,完成微博情感簇的凝聚式层次聚类,并优化得到最终的情感簇,实现微博情感分析。本发明提供一种灵活性较高、可靠性较好的融合显性和隐性特征的中文微博情感分析方法。