一种用于文本搜索的方法及设备
基本信息
申请号 | CN202110795549.4 | 申请日 | - |
公开(公告)号 | CN113515940A | 公开(公告)日 | 2021-10-19 |
申请公布号 | CN113515940A | 申请公布日 | 2021-10-19 |
分类号 | G06F40/289(2020.01)I;G06F40/216(2020.01)I;G06F40/30(2020.01)I | 分类 | 计算;推算;计数; |
发明人 | 吴鹏;王夷;张剑;李东晓;俞楠;吴翔 | 申请(专利权)人 | 上海芯翌智能科技有限公司 |
代理机构 | 上海百一领御专利代理事务所(普通合伙) | 代理人 | 王奎宇;朱永海 |
地址 | 200080上海市虹口区海宁路137号7层(集中登记地) | ||
法律状态 | - |
摘要
摘要 | 本申请提供一种用于文本搜索的技术方案,获取输入文本;基于预设词典,对输入文本进行预处理,以获得候选文本集,其中的每个候选文本包含若干词元,其中,每个词元包含词文本、词文本的标注词性及在候选文本中的位置信息;基于候选文本集及预设语料库,识别用户搜索意图,并确定候选文本集中的相关词元及其权重;根据用户搜索意图,遍历每个候选文本进行文本搜索,并基于相关词元的权重及其位置信息,对获得的搜索结果进行评分,以获得搜索结果集,其中每个搜索结果关联一个第一得分;根据每个搜索结果的第一得分对搜索结果集排序,并返回排序前N个搜索结果,其中,N是预设值。本申请的技术方案可返回精准度较高的搜索结果。 |
