一种分词检索方法及系统

基本信息

申请号 CN202111512996.0 申请日 -
公开(公告)号 CN114153949A 公开(公告)日 2022-03-08
申请公布号 CN114153949A 申请公布日 2022-03-08
分类号 G06F16/33(2019.01)I 分类 计算;推算;计数;
发明人 付雪林;王涛;孙思遥;邓应来;王启超;吴邱思;安重阳;韩啸;张葳;曾明泉;唐海霞;赵鑫;刘成书 申请(专利权)人 北京信立方科技发展股份有限公司
代理机构 - 代理人 -
地址 100032北京市西城区新街口外大街28号B座416室(德胜园区)
法律状态 -

摘要

摘要 本申请提供一种分词检索方法及系统。所述方法包括:接收用户输入的检索词;对所述检索词进行单字分词;分别计算每一语料文档的单字相关度;将单字相关度进行叠加生成语料文档的相关度得分;依据所述相关度得分对所述语料文档进行排序以生成第一检索结果。在单领域信息检索平台中,通过单字分词的方式将检索词进行拆分,再计算每一语料文档的单字相关度,通过单字相关度叠加生成的相关度得分对语料文档进行排序。检索过程能够针对数据结构类型多、用户量小、用户类型多且行业跨度大、专业性强的单领域信息检索平台进行精准的检索,不需要再耗费人工梳理语义模板,降低了单领域信息检索平台的维护成本,同时也实现了单领域信息检索平台的检索功能。