一种基于文本图谱的智能搜索引擎的检索方法

基本信息

申请号 CN202110005543.2 申请日 -
公开(公告)号 CN113204696A 公开(公告)日 2021-08-03
申请公布号 CN113204696A 申请公布日 2021-08-03
分类号 G06F16/953(2019.01)I;G06F16/332(2019.01)I;G06F16/36(2019.01)I 分类 计算;推算;计数;
发明人 王绪刚 申请(专利权)人 北京欧拉认知智能科技有限公司
代理机构 北京汇信合知识产权代理有限公司 代理人 林聪源
地址 100086北京市海淀区中关村南大街6号9层913
法律状态 -

摘要

摘要 本发明提供一种基于文本图谱的智能搜索引擎的检索方法,涉及计算机技术领域,包括获取数据信息存储至分布式系统集群中,并构建文本图谱;根据用户输入的搜索语句,建立节点查询语句;根据节点查询语句在文本图谱中匹配三元组;若匹配成功,则将匹配到的三元组中的实体作为搜索结果返回客户;若匹配不成功,则对搜索语句进行分词,获取检索词;利用余弦相似度公式计算分布式系统集群中与检索词相关性最高的实体并返回用户。本发明通过构建文本图谱,进一步根据搜索目标建立实体与关系的节点查询语句,进而根据节点查询语句在文本图谱中进行检索,能够准确快速的得到搜索目标。