并行处理中矩阵数据广播的方法
基本信息
申请号 | CN201911315653.8 | 申请日 | - |
公开(公告)号 | CN113010173A | 公开(公告)日 | 2021-06-22 |
申请公布号 | CN113010173A | 申请公布日 | 2021-06-22 |
分类号 | G06F8/41(2018.01)I;G06F9/54(2006.01)I;G06F15/78(2006.01)I | 分类 | 计算;推算;计数; |
发明人 | 彭莉;杨建;汤迟 | 申请(专利权)人 | 超威半导体(上海)有限公司 |
代理机构 | 上海胜康律师事务所 | 代理人 | 樊英如;邱晓敏 |
地址 | 201203上海市浦东新区张江高科技园区,张东路1387号科技领袖之都(东区)第48幢 | ||
法律状态 | - |
摘要
摘要 | 本发明涉及一种计算系统,具体涉及在计算系统中并行处理中矩阵数据广播的方法。公开了用于通过减少存储器访问的数量来有效并行执行处理器中的多个工作单元的系统、装置和方法。计算系统包括具有并行数据架构的处理器核。软件应用程序和固件中的一个或多个实现矩阵运算,并支持将共享数据广播到处理器核的多个计算单元。该应用程序通过将应用程序的计算内核与数据项进行匹配,并将得到的工作单元分组为线程组来创建线程组。应用程序基于检测到计算单元之间的共享数据,将线程组分配给计算单元。生成单个访问请求,而不是将多个读取访问发送到存储器子系统以获取共享数据。单个访问请求包括标识多个计算单元的信息,以在广播时接收共享数据。 |
