一种可用于大批量生成关系型模拟数据的方法

基本信息

申请号 CN201811393036.5 申请日 -
公开(公告)号 CN109241205A 公开(公告)日 2019-01-18
申请公布号 CN109241205A 申请公布日 2019-01-18
分类号 G06F16/28 分类 计算;推算;计数;
发明人 王晟 申请(专利权)人 南京安讯科技有限责任公司
代理机构 大连至诚专利代理事务所(特殊普通合伙) 代理人 南京安讯科技有限责任公司
地址 210012 江苏省南京市雨花台区软件大道119号5幢201-206室
法律状态 -

摘要

摘要 本发明公开了一种可用于大批量生成关系型模拟数据的方法,在运行过程中首先根据数据模板中的分区字段定义,生成一个或者多个分区字段构成的序列,从序列的第一个分区集合开始,通过模拟器以及逻辑规则生成一个本地文件,待该本地文件导入到Hive仓库指定位置后,进入第二个分区集合开始进行模拟,此时将会生成第二个本地文件。第二个本地文件将逐行参照首个本地文件,平移不变的关键字段,在符合逻辑规则的前提下改变剩余的字段。