一种可用于大批量生成关系型模拟数据的方法
基本信息
申请号 | CN201811393036.5 | 申请日 | - |
公开(公告)号 | CN109241205A | 公开(公告)日 | 2019-01-18 |
申请公布号 | CN109241205A | 申请公布日 | 2019-01-18 |
分类号 | G06F16/28 | 分类 | 计算;推算;计数; |
发明人 | 王晟 | 申请(专利权)人 | 南京安讯科技有限责任公司 |
代理机构 | 大连至诚专利代理事务所(特殊普通合伙) | 代理人 | 南京安讯科技有限责任公司 |
地址 | 210012 江苏省南京市雨花台区软件大道119号5幢201-206室 | ||
法律状态 | - |
摘要
摘要 | 本发明公开了一种可用于大批量生成关系型模拟数据的方法,在运行过程中首先根据数据模板中的分区字段定义,生成一个或者多个分区字段构成的序列,从序列的第一个分区集合开始,通过模拟器以及逻辑规则生成一个本地文件,待该本地文件导入到Hive仓库指定位置后,进入第二个分区集合开始进行模拟,此时将会生成第二个本地文件。第二个本地文件将逐行参照首个本地文件,平移不变的关键字段,在符合逻辑规则的前提下改变剩余的字段。 |
