一种基于自回归与自编码的语义相似度获取方法

基本信息

申请号 CN201911362305.6 申请日 -
公开(公告)号 CN111144129A 公开(公告)日 2020-05-12
申请公布号 CN111144129A 申请公布日 2020-05-12
分类号 G06F40/30;G06F40/284;G06N3/04 分类 计算;推算;计数;
发明人 王开业;蒋登位;崔斌;谭启涛 申请(专利权)人 成都航天科工大数据研究院有限公司
代理机构 成都顶峰专利事务所(普通合伙) 代理人 成都航天科工大数据研究院有限公司
地址 610000 四川省成都市天府新区天府新经济产业园D区A6号楼4层
法律状态 -

摘要

摘要 本发明属于深度学习技术领域,公开了一种基于自回归与自编码的语义相似度获取方法,包括如下步骤:S1:根据输入的原始文本,进行文本表征,获取优化的内容特征和查询特征;S2:根据上述步骤得到的内容特征和查询特征,使用优化语义提取模型进行语义特征提取;S3:根据上述步骤提取的原始文本的语义特征和现有的目标文本的语义特征,获取语义相似度。本发明提高了中文语言文本表征的准确性和文本相似度计算的准确率,解决了现有技术存在的性能损失、无法分辨单词关系以及单向问题。