一种自动筛选问题答案的方法、终端设备及存储介质

基本信息

申请号 CN201910954584.9 申请日 -
公开(公告)号 CN110688472A 公开(公告)日 2020-01-14
申请公布号 CN110688472A 申请公布日 2020-01-14
分类号 G06F16/332;G06F40/284 分类 计算;推算;计数;
发明人 刘继明;肖肇宇;谭云丹;高力伟 申请(专利权)人 厦门今立方科技有限公司
代理机构 厦门市精诚新创知识产权代理有限公司 代理人 何家富
地址 361000 福建省厦门市软件园三期诚毅大街339号1903单元
法律状态 -

摘要

摘要 本发明涉及一种自动筛选问题答案的方法、终端设备及存储介质,该方法中包括:将待回答问题数据进行预处理;将待回答预处理后的问题数据进行同义词归一化操作;根据待回答问题数据与数据库中的问题的第一相似度、第二相似度和第三相似度的大小,计算数据库中相似度最终排名第一的问题数据;将最终排名第一的问题数据在数据库中对应的答案作为待回答问题数据的答案。本发明改进了目前大部分基于词嵌入的相似度算法中不考虑句子的词序及语义的问题,引入了基于词流特征的第二相似度和基于向心词槽的第三相似度的计算,可以用于表征文本之间词序以及语义的隐藏关联,提升了相似度计算的准确度与稳定性,在各项表现上均有所提升。