一种人工智能加速器的核函数编译方法和装置

基本信息

申请号 CN202110812211.5 申请日 -
公开(公告)号 CN113467783A 公开(公告)日 2021-10-01
申请公布号 CN113467783A 申请公布日 2021-10-01
分类号 G06F8/41(2018.01)I;G06N3/08(2006.01)I 分类 计算;推算;计数;
发明人 文进辉;胡辰卜;景德 申请(专利权)人 中科曙光国际信息产业有限公司
代理机构 北京品源专利代理有限公司 代理人 孔凡红
地址 266101山东省青岛市崂山区松岭路169号软件园A区211房间
法律状态 -

摘要

摘要 本发明实施例公开了一种人工智能加速器的核函数编译方法、装置、电子设备及存储介质,该方法包括:获取人工智能加速器的目标源码文件并解析,以获取至少一个深度学习段落;根据人工智能加速器的硬件结构参数、核函数性能参数以及深度学习段落的输入参数结构,获取至少一个配置参数组,并根据至少一个配置参数组和至少一个初始核函数,获取至少一个配置核函数;编译至少一个配置核函数,并获取至少一个配置核函数中运算速度最快的最优配置核函数。本发明实施例提供的技术方案,通过代码扫描及后台的代码编译运行,完成深度学习操作的最优配置核函数的获取,极大地减少了AI加速器针对深度学习训练的编译时长,提高了AI加速器的计算效率。