一种数据交叉分析方法、装置、计算机设备和存储介质

基本信息

申请号 CN202110100415.6 申请日 -
公开(公告)号 CN112434048B 公开(公告)日 2021-04-30
申请公布号 CN112434048B 申请公布日 2021-04-30
分类号 G06F16/22;G06F16/242;G06F16/2455;G06F16/2458;G06F16/215;G06F40/174 分类 计算;推算;计数;
发明人 沈红程;李晓辉;许琮浩 申请(专利权)人 杭州城市大数据运营有限公司
代理机构 杭州鼎乎专利代理事务所(普通合伙) 代理人 黄勇
地址 313000 浙江省湖州市吴兴区双子大厦2201-2205室
法律状态 -

摘要

摘要 本发明属于数据处理技术领域,尤其涉及一种数据交叉分析方法、装置、计算机设备和存储介质。方法包括:获取目标数据表,并对目标数据表增设表名编码列;根据预设的第一筛选条件对目标数据表进行筛选,将所有目标数据表的数据进行合并,形成第一中间结果集;将第一中间结果集的数据按照目标字段进行分组并对表名编码列值进行统计汇总,形成第二中间结果集;对第二中间结果集的各个分组的表名编码列的汇总值进行统计汇总;根据各个分组的各类表名编码列汇总值及其数量,确定所有目标数据表之间的交集和/或差集关系。本发明实施例提供的一种数据交叉分析方法,能够一次性得到所有数据表之间的交集、差集等分析结果,可以极大地提高分析的效率。