一种面向多核计算环境的BP神经网络并行化方法
基本信息
申请号 | CN201710073067.1 | 申请日 | - |
公开(公告)号 | CN106909971A | 公开(公告)日 | 2017-06-30 |
申请公布号 | CN106909971A | 申请公布日 | 2017-06-30 |
分类号 | G06N3/08;G06F9/50;G06F12/0893;G06F12/0897 | 分类 | 计算;推算;计数; |
发明人 | 汤德佑;梁珩琳;曾庆淼;张亚卓;汤达祺;邹春刚 | 申请(专利权)人 | 广州讯鸿网络技术有限公司 |
代理机构 | 广州市华学知识产权代理有限公司 | 代理人 | 华南理工大学;广州讯鸿网络技术有限公司 |
地址 | 广东省广州市天河区五山路381号 | ||
法律状态 | - |
摘要
摘要 | 本发明提供了一种面向多核计算环境的BP神经网络并行化方法。包括:并行计算任务划分及映射方法;存储各层中间计算结果的缓存设置方法;BP神经网络的并行训练方法。所述对含P个计算单元的硬件平台,任务划分方法对将隐藏层和输出层计算任务整体组合成一个粒度更大任务,提高并行性;所述缓存设置方法,在一趟训练过程中,同一变量被上一个子任务访问后可用于下一个子任务,下一个子任务不会产生Cache缺失;所述BP神经网络训练方法中,样本分成K批进入网络训练,K值的设计综合计算平台的二级缓存大小,与缓存设置相结合,最大限度发挥硬件性能,适用于多核计算平台下的BP神经网络应用。 |
