基于关联数据的自治数据湖构建系统及方法

基本信息

申请号 CN201911131738.0 申请日 -
公开(公告)号 CN110941612B 公开(公告)日 2020-03-31
申请公布号 CN110941612B 申请公布日 2020-03-31
分类号 G06F16/22(2019.01)I 分类 计算;推算;计数;
发明人 蔡鸿明;黄佳卉;张贝格;于晗;雷连松;姜丽红 申请(专利权)人 南京润辰科技有限公司
代理机构 上海交达专利事务所 代理人 王毓理;王锡麟
地址 变更后权利人:210000 江苏省南京市雨花台区软件大道168号2幢西1011室
法律状态 -

摘要

摘要 一种基于关联数据的自治数据湖构建系统及方法,该系统包括:数据源输入模块、异构数据预处理模块、元数据发现与抽取模块、元数据融合与关联模块、元模型优化与构建模块、实例知识抽取模块、知识封装模块、知识校正与融合模块、实例概念抽取模块和元模型验证与演化模块;本发明基于关联数据,在构建数据湖的同时,生成实时更新的目录索引和可通过目录快速定位的实例知识图谱,通过其内在结构和语义关联最终得到一个具有自治能力的数据湖,使其易于被外部用户管理、检索及满足更多需求。