基于关联数据的自治数据湖构建系统及方法
基本信息
申请号 | CN201911131738.0 | 申请日 | - |
公开(公告)号 | CN110941612B | 公开(公告)日 | 2020-03-31 |
申请公布号 | CN110941612B | 申请公布日 | 2020-03-31 |
分类号 | G06F16/22(2019.01)I | 分类 | 计算;推算;计数; |
发明人 | 蔡鸿明;黄佳卉;张贝格;于晗;雷连松;姜丽红 | 申请(专利权)人 | 南京润辰科技有限公司 |
代理机构 | 上海交达专利事务所 | 代理人 | 王毓理;王锡麟 |
地址 | 变更后权利人:210000 江苏省南京市雨花台区软件大道168号2幢西1011室 | ||
法律状态 | - |
摘要
摘要 | 一种基于关联数据的自治数据湖构建系统及方法,该系统包括:数据源输入模块、异构数据预处理模块、元数据发现与抽取模块、元数据融合与关联模块、元模型优化与构建模块、实例知识抽取模块、知识封装模块、知识校正与融合模块、实例概念抽取模块和元模型验证与演化模块;本发明基于关联数据,在构建数据湖的同时,生成实时更新的目录索引和可通过目录快速定位的实例知识图谱,通过其内在结构和语义关联最终得到一个具有自治能力的数据湖,使其易于被外部用户管理、检索及满足更多需求。 |
