一种评论观点主题抽取方法、电子设备及存储介质
基本信息
申请号 | CN202010772735.1 | 申请日 | - |
公开(公告)号 | CN112131863A | 公开(公告)日 | 2020-12-25 |
申请公布号 | CN112131863A | 申请公布日 | 2020-12-25 |
分类号 | G06F40/216(2020.01)I | 分类 | 计算;推算;计数; |
发明人 | 周少龙;冯若凡;余智华;陈欣洁;冯凯 | 申请(专利权)人 | 中科天玑数据科技股份有限公司 |
代理机构 | 北京沁优知识产权代理有限公司 | 代理人 | 中科天玑数据科技股份有限公司 |
地址 | 100000北京市海淀区中关村科学院南路6号科研综合楼900房间 | ||
法律状态 | - |
摘要
摘要 | 本发明提供了一种评论观点主题抽取方法,包括:采集社交软件中评论,获得评论文本;对所述评论文本进行预处理,将评论文本转换为词向量,形成文本向量;构建观点句分类模型,判断所述评论文本中的句子是否为观点句;聚类所述观点句形成观点主题簇,分别抽取所述观点主题簇中的关键词作为候选观点关键词;在所述候选观点关键词中抽选关键词,并根据词性选择核心词;将与所述核心词匹配的观点句生成主题,形成主题候选集;从每个类别的所述主题候选集中选择一个主题作为最终观点主题。本发明还提供了电子设备和存储介质。从评论文本自动抽取观点主题,以便准确接收网民意见,并判断是否对社会造成舆论,能够直观地了解到社交软件的相关热点话题。 |
