一种人工智能加速器的核函数编译方法和装置
基本信息
申请号 | CN202110812211.5 | 申请日 | - |
公开(公告)号 | CN113467783A | 公开(公告)日 | 2021-10-01 |
申请公布号 | CN113467783A | 申请公布日 | 2021-10-01 |
分类号 | G06F8/41(2018.01)I;G06N3/08(2006.01)I | 分类 | 计算;推算;计数; |
发明人 | 文进辉;胡辰卜;景德 | 申请(专利权)人 | 中科曙光国际信息产业有限公司 |
代理机构 | 北京品源专利代理有限公司 | 代理人 | 孔凡红 |
地址 | 266101山东省青岛市崂山区松岭路169号软件园A区211房间 | ||
法律状态 | - |
摘要
摘要 | 本发明实施例公开了一种人工智能加速器的核函数编译方法、装置、电子设备及存储介质,该方法包括:获取人工智能加速器的目标源码文件并解析,以获取至少一个深度学习段落;根据人工智能加速器的硬件结构参数、核函数性能参数以及深度学习段落的输入参数结构,获取至少一个配置参数组,并根据至少一个配置参数组和至少一个初始核函数,获取至少一个配置核函数;编译至少一个配置核函数,并获取至少一个配置核函数中运算速度最快的最优配置核函数。本发明实施例提供的技术方案,通过代码扫描及后台的代码编译运行,完成深度学习操作的最优配置核函数的获取,极大地减少了AI加速器针对深度学习训练的编译时长,提高了AI加速器的计算效率。 |
