一种句子相似度的计算方法及基于该方法的舆情监督方法
基本信息
申请号 | CN201810148814.8 | 申请日 | - |
公开(公告)号 | CN108363692B | 公开(公告)日 | 2021-04-02 |
申请公布号 | CN108363692B | 申请公布日 | 2021-04-02 |
分类号 | G06F40/279(2020.01)I;G06F40/58(2020.01)I;G06F40/289(2020.01)I | 分类 | 计算;推算;计数; |
发明人 | 马晓敏;李为民 | 申请(专利权)人 | 成都智库二八六一信息技术有限公司 |
代理机构 | 成都行之专利代理事务所(普通合伙) | 代理人 | 王记明 |
地址 | 610000四川省成都市高新区益州大道中段1800号304室 | ||
法律状态 | - |
摘要
摘要 | 本发明公开了一种句子相似度的计算方法及基于该方法的舆情监督方法,该方法包括:从互联网获取舆情事件语料,进行内容清洗后,将语料切分成短句;建立情绪语料库和情况语料库,将描述性短句放入情况库,表达情绪的短句放入情绪库,并根据情绪激烈程度对短句标注权重;将待识别长句切分成待识别短句,分别利用改进的句子相似度计算方法,计算其与情况库和情绪库中语料的相似度,确定长句情绪值;依照上述步骤依次对某一目标长句群进行识别,得到舆情事件所描述的诱因和情绪值分布。本发明的积极效果是:能够对细分领域舆情实现比较高的识别准确率,解决了相关技术中识别领域过于粗糙的问题。 |
