一种知识图谱批量离线查询解决方案

基本信息

申请号 CN201910747130.4 申请日 -
公开(公告)号 CN112395365B 公开(公告)日 2022-02-08
申请公布号 CN112395365B 申请公布日 2022-02-08
分类号 G06F16/28(2019.01)I;G06F16/332(2019.01)I;G06F16/35(2019.01)I;G06F16/36(2019.01)I 分类 计算;推算;计数;
发明人 梁志勇 申请(专利权)人 北京海致星图科技有限公司
代理机构 北京棘龙知识产权代理有限公司 代理人 谢静
地址 100083北京市海淀区学院路甲5号2幢平房B南1011
法律状态 -

摘要

摘要 本发明公开了一种知识图谱批量离线查询解决方案,该解决方案核心思路是将原有的图谱数据库内部执行的多度查询分解为多个1度K层展开,辅以图谱数据库的部分改造,具体实施细节如下:1)首先由Java应用程序往Spark Graphx传入开始检索的批量实体。有益效果在于:本发明通过对批量实体进行分类存储,并对图谱数据库进行了定制化改造,使得接口可接收的K层展开目标实体不局限于单个,而是允许按照类型对多个实体进行批量处理,从而减少应用程序和图谱数据库之间的交互通信次数,进而能够在实体及关系的总和超过100亿的数据量下,进行1万个以上节点的K层展开和多对多实体关系1度以上的批量离线查询时,能够有效将耗时降低到60秒,提高了查询的效率。