一种分词检索方法及系统
基本信息
申请号 | CN202111512996.0 | 申请日 | - |
公开(公告)号 | CN114153949A | 公开(公告)日 | 2022-03-08 |
申请公布号 | CN114153949A | 申请公布日 | 2022-03-08 |
分类号 | G06F16/33(2019.01)I | 分类 | 计算;推算;计数; |
发明人 | 付雪林;王涛;孙思遥;邓应来;王启超;吴邱思;安重阳;韩啸;张葳;曾明泉;唐海霞;赵鑫;刘成书 | 申请(专利权)人 | 北京信立方科技发展股份有限公司 |
代理机构 | - | 代理人 | - |
地址 | 100032北京市西城区新街口外大街28号B座416室(德胜园区) | ||
法律状态 | - |
摘要
摘要 | 本申请提供一种分词检索方法及系统。所述方法包括:接收用户输入的检索词;对所述检索词进行单字分词;分别计算每一语料文档的单字相关度;将单字相关度进行叠加生成语料文档的相关度得分;依据所述相关度得分对所述语料文档进行排序以生成第一检索结果。在单领域信息检索平台中,通过单字分词的方式将检索词进行拆分,再计算每一语料文档的单字相关度,通过单字相关度叠加生成的相关度得分对语料文档进行排序。检索过程能够针对数据结构类型多、用户量小、用户类型多且行业跨度大、专业性强的单领域信息检索平台进行精准的检索,不需要再耗费人工梳理语义模板,降低了单领域信息检索平台的维护成本,同时也实现了单领域信息检索平台的检索功能。 |
