一种基于无监督的长短影评细粒度观点挖掘方法
基本信息
申请号 | CN202110904457.5 | 申请日 | - |
公开(公告)号 | CN113641788A | 公开(公告)日 | 2021-11-12 |
申请公布号 | CN113641788A | 申请公布日 | 2021-11-12 |
分类号 | G06F16/33(2019.01)I;G06F16/35(2019.01)I;G06F16/951(2019.01)I;G06F40/194(2020.01)I;G06F40/242(2020.01)I;G06F40/289(2020.01)I;G06F40/30(2020.01)I;G06K9/62(2006.01)I;G06N3/08(2006.01)I | 分类 | 计算;推算;计数; |
发明人 | 秦涛;刘炉林;刘博豪;李悦;史镇光;靳国庆 | 申请(专利权)人 | 人民网股份有限公司 |
代理机构 | 西安智大知识产权代理事务所 | 代理人 | 段俊涛 |
地址 | 100035北京市西城区新街口外大街28号B座234号 | ||
法律状态 | - |
摘要
摘要 | 本发明公开了一种基于无监督的长短影评细粒度观点挖掘方法,其特征在于:1)从社交平台和电影平台进行多维度的影评文本信息获取;2)基于开源中文情感词典,采用SO‑PMI词典扩展方法构建影评情感词典;3)采用基于关联规则方法和word2vec挖掘全局评价对象和个性化评价对象,再通过K‑means形成完整短影评评价对象;4)采用MG‑LDA结合word2vec发现长影评的主题分布以及词分布,构建长影评评价对象;5)对评价对象进行情感分析并形成影评观点摘要。本发明所公开无监督长短影评细粒度观点挖掘方法,较现有的影评挖掘方法相比,可以获取更丰富的影评文本数据,充分挖掘影评文本信息,针对影评长短采用不同的模型获取评价对象,使得本发明的观点挖掘和情感分析效果更佳。 |
