基于文本相似度算法的相似问题生成方法、系统、电子装置和存储介质

基本信息

申请号 CN202110367263.6 申请日 -
公开(公告)号 CN113139040A 公开(公告)日 2021-07-20
申请公布号 CN113139040A 申请公布日 2021-07-20
分类号 G06F16/332(2019.01)I;G06K9/62(2006.01)I 分类 计算;推算;计数;
发明人 嵇望;王伟凯;钱艳;朱鹏飞;安毫亿;梁青 申请(专利权)人 杭州远传新业科技股份有限公司
代理机构 杭州创智卓英知识产权代理事务所(普通合伙) 代理人 张超
地址 310051浙江省杭州市滨江区信诚路857号世贸中心23楼
法律状态 -

摘要

摘要 本申请涉及一种基于文本相似度算法的相似问题生成方法、系统、电子装置和存储介质,其中,该基于文本相似度算法的相似问题生成方法包括:获取交互场景文本数据,生成问答对文本;计算问答对文本中的答案文本与行业问答对中的答案文本的文本相似度,确定相似度最大的行业问答对;计算问答对文本中的问题文本与相似度最大的行业问答对中的问题文本的文本相似度,确定问题文本相似度最大值;将问题文本的相似度最大值与预设阈值进行比对,若满足预设阈值,则将问题文本相似度最大值对应的问答对文本中的问题文本补充到对应的行业问答对语料中作为问题文本的相似问题。通过本申请,解决了相关技术中生成的相似问题语句不通顺和包含冗余内容的问题。