一种用于文本搜索的方法及设备

基本信息

申请号 CN202110795549.4 申请日 -
公开(公告)号 CN113515940A 公开(公告)日 2021-10-19
申请公布号 CN113515940A 申请公布日 2021-10-19
分类号 G06F40/289(2020.01)I;G06F40/216(2020.01)I;G06F40/30(2020.01)I 分类 计算;推算;计数;
发明人 吴鹏;王夷;张剑;李东晓;俞楠;吴翔 申请(专利权)人 上海芯翌智能科技有限公司
代理机构 上海百一领御专利代理事务所(普通合伙) 代理人 王奎宇;朱永海
地址 200080上海市虹口区海宁路137号7层(集中登记地)
法律状态 -

摘要

摘要 本申请提供一种用于文本搜索的技术方案,获取输入文本;基于预设词典,对输入文本进行预处理,以获得候选文本集,其中的每个候选文本包含若干词元,其中,每个词元包含词文本、词文本的标注词性及在候选文本中的位置信息;基于候选文本集及预设语料库,识别用户搜索意图,并确定候选文本集中的相关词元及其权重;根据用户搜索意图,遍历每个候选文本进行文本搜索,并基于相关词元的权重及其位置信息,对获得的搜索结果进行评分,以获得搜索结果集,其中每个搜索结果关联一个第一得分;根据每个搜索结果的第一得分对搜索结果集排序,并返回排序前N个搜索结果,其中,N是预设值。本申请的技术方案可返回精准度较高的搜索结果。