文本检索方法、装置、计算机设备和存储介质

基本信息

申请号 CN202010545374.7 申请日 -
公开(公告)号 CN111444320A 公开(公告)日 2020-07-24
申请公布号 CN111444320A 申请公布日 2020-07-24
分类号 G06F16/33(2019.01)I 分类 计算;推算;计数;
发明人 时爱民;杨刚;叶俊锋;仲如星 申请(专利权)人 太平财产保险有限公司
代理机构 广州华进联合专利商标代理有限公司 代理人 黄丽霞
地址 201201上海市浦东新区卡园三路58号
法律状态 -

摘要

摘要 本申请涉及一种文本检索方法、装置、计算机设备和存储介质。所述方法通过响应于文本检索请求,将文本检索请求中的检索语句在待检索文本集中通过TF‑IDF算法进行匹配,得到匹配的设定个数的候选文本,并通过语义表示学习模型获取检索语句的第一特征向量和每个候选文本中重要文本段的第二特征向量,并根据检索语句的第一特征向量和每个候选文本中重要文本段的第二特征向量之间的相似度,获取相似度较高的目标个数的候选文本,进而根据目标个数的候选文本中每个候选文本相对于检索语句的历史关联度的大小对目标个数的候选文本进行排序,其通过两次筛选和排序从而实现基于语义理解的文本检索,不仅提高了文本检索的匹配度,且提高了检索效率。