一种短文本相似度计算系统及其训练方法

基本信息

申请号 CN201911375500.2 申请日 -
公开(公告)号 CN111209395A 公开(公告)日 2020-05-29
申请公布号 CN111209395A 申请公布日 2020-05-29
分类号 G06F16/35;G06F40/117;G06F40/126;G06F40/205;G06F40/30;G06N3/08 分类 计算;推算;计数;
发明人 王丙栋;游世学 申请(专利权)人 铜陵中科汇联科技有限公司
代理机构 北京庆峰财智知识产权代理事务所(普通合伙) 代理人 铜陵中科汇联科技有限公司
地址 244000 安徽省铜陵市北斗星城1-A1楼9楼
法律状态 -

摘要

摘要 本申请公布了一种短文本相似度计算系统及其训练方法,所述系统包含以下模块:文本切分模块、文本编码器、文本相似度计算神经网络模块。本申请的短文本相似度计算系统,对需要计算相似度的两个短文本编码使用相同的编码器,再使用注意力机制得到第一个文本对第二个文本的注意力,归一化注意力得到相似度的值。本申请的神经网络有效利用了文本中词语在上下文的语义编码以及文本整体的语义编码,使用注意力来表征相似度,缓解了文本级语义编码的信息损失,避免了词语级语义编码孤立于上下文的问题。