一种产业知识库自动构建方法、装置及存储介质

基本信息

申请号 CN202011064551.6 申请日 -
公开(公告)号 CN112307153A 公开(公告)日 2021-02-02
申请公布号 CN112307153A 申请公布日 2021-02-02
分类号 G06F16/31(2019.01)I; 分类 计算;推算;计数;
发明人 宗畅;王云飞;杨彦飞;许克明;邵健 申请(专利权)人 杭州量知数据科技有限公司
代理机构 杭州求是专利事务所有限公司 代理人 傅朝栋;张法高
地址 310000浙江省杭州市萧山区经济技术开发区明星路371号1幢601室
法律状态 -

摘要

摘要 本发明公开了一种产业知识库自动构建方法、装置及存储介质。本发明在梳理出产业领域概念体系的前提下,针对不同类型的数据来源,利用模型、规则、词典等先验知识,对企业、人才等核心实体类型及其之间的关系进行高效构建,并支持对知识的按需批量更新;此外,针对产业资讯等非结构化文档数据,利用深度学习与规则相结合的方法,对文档本身进行碎片化和语义标引,对核心事件类型进行面向主体的细粒度事件抽取,并通过设计标准化文本信息抽取数据结构解决各处理阶段输出的服务及其之间的通信问题;进一步通过基于上下文的实体链接技术,实现对企业和人才等核心实体的动态事件获取,并辅助指导更新已有知识,进一步丰富产业知识维度。