一种基于SE卷积网络的乐器识别方法及系统
基本信息
申请号 | CN201910569242.5 | 申请日 | - |
公开(公告)号 | CN110310666B | 公开(公告)日 | 2021-07-23 |
申请公布号 | CN110310666B | 申请公布日 | 2021-07-23 |
分类号 | G10L25/51(2013.01)I;G10L25/30(2013.01)I;G10L21/10(2013.01)I | 分类 | 乐器;声学; |
发明人 | 尹学渊;祁松茂;江天宇 | 申请(专利权)人 | 成都潜在人工智能科技有限公司 |
代理机构 | 成都睿道专利代理事务所(普通合伙) | 代理人 | 贺理兴 |
地址 | 610041四川省成都市高新区益州大道中段722号1栋1单元12层1210号 | ||
法律状态 | - |
摘要
摘要 | 本发明公开了一种基于SE卷积网络的乐器识别方法及系统,方法包括如下步骤:待识别数据预处理,将待识别音频文件转换为待识别自相关谱图;待识别数据识别,将待识别自相关谱图输入预先构建的乐器识别模型进行识别,得到输出结果矩阵;乐器解析,将乐器识别模型的输出结果矩阵整合解析为自然语言表示的乐器标签。该方法将待识别音频文件转换为自相关谱图,自相关谱图采用自相关算法,能够有效克服短时傅里叶变换的不足,利用预先构建的乐器识别模型对自相关谱图进行处理,能够识别出音频数据所使用的乐器种类,对真实场景的复调音乐有着较高的识别率,且识别速度较快,可以极大地降低人工成本,节省时间,提升效率。 |
