一种基于无监督的长短影评细粒度观点挖掘方法

基本信息

申请号 CN202110904457.5 申请日 -
公开(公告)号 CN113641788A 公开(公告)日 2021-11-12
申请公布号 CN113641788A 申请公布日 2021-11-12
分类号 G06F16/33(2019.01)I;G06F16/35(2019.01)I;G06F16/951(2019.01)I;G06F40/194(2020.01)I;G06F40/242(2020.01)I;G06F40/289(2020.01)I;G06F40/30(2020.01)I;G06K9/62(2006.01)I;G06N3/08(2006.01)I 分类 计算;推算;计数;
发明人 秦涛;刘炉林;刘博豪;李悦;史镇光;靳国庆 申请(专利权)人 人民网股份有限公司
代理机构 西安智大知识产权代理事务所 代理人 段俊涛
地址 100035北京市西城区新街口外大街28号B座234号
法律状态 -

摘要

摘要 本发明公开了一种基于无监督的长短影评细粒度观点挖掘方法,其特征在于:1)从社交平台和电影平台进行多维度的影评文本信息获取;2)基于开源中文情感词典,采用SO‑PMI词典扩展方法构建影评情感词典;3)采用基于关联规则方法和word2vec挖掘全局评价对象和个性化评价对象,再通过K‑means形成完整短影评评价对象;4)采用MG‑LDA结合word2vec发现长影评的主题分布以及词分布,构建长影评评价对象;5)对评价对象进行情感分析并形成影评观点摘要。本发明所公开无监督长短影评细粒度观点挖掘方法,较现有的影评挖掘方法相比,可以获取更丰富的影评文本数据,充分挖掘影评文本信息,针对影评长短采用不同的模型获取评价对象,使得本发明的观点挖掘和情感分析效果更佳。