基于命名实体库的在线知识地图
基本信息
申请号 | CN201410199271.4 | 申请日 | - |
公开(公告)号 | CN103955531A | 公开(公告)日 | 2014-07-30 |
申请公布号 | CN103955531A | 申请公布日 | 2014-07-30 |
分类号 | G06F17/30(2006.01)I | 分类 | 计算;推算;计数; |
发明人 | 李华康;过敏意;沈耀 | 申请(专利权)人 | 南京提坦信息科技有限公司 |
代理机构 | 北京联瑞联丰知识产权代理事务所(普通合伙) | 代理人 | 南京提坦信息科技有限公司 |
地址 | 210000 江苏省南京市南京溧水经济开发区柘宁东路368号资金(溧水)科技创业特别社区国家千人智慧产业园419室 | ||
法律状态 | - |
摘要
摘要 | 本发明公开了基于命名实体库的在线知识地图,包括以下步骤:步骤1)爬取网页,向整个互联网爬取网页信息,得到互联网数据集;步骤2)抽取命名实体;步骤3)寻找属性词,遍历步骤1中的互联网数据集,建立命名实体与属性词关系集合;步骤4)量化信息,量化属性集合中属性词与命名实体之间的关联关系;步骤5)建立知识地图,通过命名实体关联的属性词集之间的关系,建立命名实体与命名实体之间的拓扑结构,形成知识地图;步骤6)更新。本发明从海量新增网页文本信息中抽取命名实体,自动地建立实体节点与节点之间的关联关系,根据知识节点及其之间的关联关系建立知识地图,并能高效地实现知识地图的更新。 |
