一种事实数据集和维数据集全在内存中的指针计算多对一join的方法
基本信息
申请号 | CN201710777222.8 | 申请日 | - |
公开(公告)号 | CN107562876A | 公开(公告)日 | 2018-01-09 |
申请公布号 | CN107562876A | 申请公布日 | 2018-01-09 |
分类号 | G06F17/30(2006.01)I | 分类 | 计算;推算;计数; |
发明人 | 蒋步星 | 申请(专利权)人 | 北京润乾信息系统技术有限公司 |
代理机构 | - | 代理人 | - |
地址 | 100085 北京市海淀区上地四街8号华成大厦501 | ||
法律状态 | - |
摘要
摘要 | 本发明提供了一种事实数据集和维数据集全在内存中的指针计算多对一join的方法。在机器内存足够大的情况下,往内存中加载两个数据集,事实数据集A和维数据集B,内存必须比事实数据集A和维数据集B的数据量所占的空间大;他们是多对一join的映射关系,事实数据集A中的外键对应维数据集B中的主键;然后进行准备工作,把事实数据集A中的外键键值替换成所对应维数据集B中主键键值所在记录的内存地址,替换所需要的时间可以用hash方法算出;以后再从事实数据集A中外键键值找对应维数据集B中主键键值所在的记录,就可以根据内存地址直接找到维数据集B中对应的记录了,就直接可以引用这条记录了。 |
