基于mapreduce框架的超大规模稀疏矩阵乘法运算的方法

基本信息

申请号 CN201410845357.X 申请日 -
公开(公告)号 CN104462023B 公开(公告)日 2017-07-21
申请公布号 CN104462023B 申请公布日 2017-07-21
分类号 G06F17/16(2006.01)I 分类 计算;推算;计数;
发明人 蒋伟;姚键;潘柏宇;卢述奇 申请(专利权)人 阿里巴巴(北京)软件服务有限公司
代理机构 北京市天玺沐泽专利代理事务所(普通合伙) 代理人 合一网络技术(北京)有限公司;阿里巴巴(中国)有限公司
地址 100080 北京市海淀区海淀大街8号中钢国际广场A座5层A、C区
法律状态 -

摘要

摘要 一种基于mapreduce框架下的大规模稀疏矩阵乘法运算的方法,所述算法由2个mapreduce的job完成,对矩阵A和矩阵B的元素进行正确的分组,使得矩阵A的第i列的元素与矩阵B的第k行的元素进入到同一个reduce的group中,并对该group中每一个来自A的元素和来自B的元素做一次乘积。本发明只需要2个mapreduce操作就可以完成超大规模系数矩阵的乘法,减少算法的运行步骤和时间,本发明降低了对机器内存的要求,只需要机器能用hashmap存储矩阵A的每一行即可进行。