利用知识图谱计算文本和主体相关度的方法以及装置

基本信息

申请号 CN201810567101.5 申请日 -
公开(公告)号 CN109033132B 公开(公告)日 2018-12-18
申请公布号 CN109033132B 申请公布日 2018-12-18
分类号 G06F16/36(2019.01)I;G06F40/284(2020.01)I 分类 计算;推算;计数;
发明人 孙雨轩;吴成龙;周劼人 申请(专利权)人 中证数智科技(深圳)有限公司
代理机构 - 代理人 -
地址 518000广东省深圳市福田区深南大道2012号深圳证券交易所广场44楼
法律状态 -

摘要

摘要 本发明公开了一种利用知识图谱计算文本和主体相关度的方法以及装置,所述方法包括:获取文本;对文本进行分词处理,提取文本中出现的关键词集合,通过预先建立的知识图谱,检索与关键词相关联的企业主体,以将所述与关键词相关联的企业主体作为候选的企业集合,其中,所述知识图谱包括目标节点信息、相关联的节点信息、所述目标节点信息与所述相关联的节点信息之间的关系及关联性权重,所述目标节点信息包括第一企业主体信息,所述相关联的节点信息包括与所述第一主体企业主体信息相关联的第二主体信息、产品或自然人信息;根据所述候选的企业集合中的候选的企业主体关联的关键词出现的词频计算文本与所述候选的企业主体的关联度。