一种基于突发事件的词向量语言模型

基本信息

申请号 CN201910915299.6 申请日 -
公开(公告)号 CN110688485A 公开(公告)日 2020-01-14
申请公布号 CN110688485A 申请公布日 2020-01-14
分类号 G06F16/35(2019.01); G06F40/30(2020.01); G06F40/289(2020.01); G06K9/62(2006.01); G06N3/04(2006.01) 分类 计算;推算;计数;
发明人 赵鑫; 朱秋昱; 张明 申请(专利权)人 杭州笔声智能科技有限公司
代理机构 北京邦创至诚知识产权代理事务所(普通合伙) 代理人 中国人民大学; 杭州笔声智能科技有限公司
地址 100872 北京市海淀区中关村大街59号
法律状态 -

摘要

摘要 本发明提供了一种基于突发事件的词向量语言模型,所述语言模型使用传统的Word2Vec模型对上下文进行训练,所述训练包括在模型的输入层计算出输入的隐藏层信息同时在输入层加入突发事件的向量表示将和通过加权求和得到最终的隐藏层表示使二者共同影响最终隐藏层表示,生成的隐藏层表示不仅与所述上下文相关,而且和所述突发事件相关。本发明提出了一种新的与突发事件相关的词向量模型,用于包含突发事件的文本流数据建模。本发明能够学习带有突发事件特点的词向量模型来识别语义变化,并且加入了突发事件向量表示来提高语义相关性。