一种基于深度学习的音频自动化标注方法
基本信息
申请号 | CN201810050808.9 | 申请日 | - |
公开(公告)号 | CN108053836B | 公开(公告)日 | 2021-03-23 |
申请公布号 | CN108053836B | 申请公布日 | 2021-03-23 |
分类号 | G06F16/61(2019.01)I;G10L25/48(2013.01)I;G10L25/30(2013.01)I;G10L25/03(2013.01)I;G06F16/683(2019.01)I | 分类 | 乐器;声学; |
发明人 | 尹学渊;江天宇 | 申请(专利权)人 | 成都嗨翻屋科技有限公司 |
代理机构 | 四川力久律师事务所 | 代理人 | 刘童笛 |
地址 | 610000四川省成都市中国(四川)自由贸易试验区成都高新区益州大道中段722号1幢1单元12层1201号 | ||
法律状态 | - |
摘要
摘要 | 本发明涉及一种音频标注方法,特别涉及一种基于深度学习的音频自动化标注方法。一种基于深度学习的音频自动化标注方法,包括以下实现步骤:输入原始音频文件,通过音频预处理,得到若干个原始语谱图片段;将所述原始语谱图片段输入卷积神经网络中进行训练,构建深度学习模型;输入待标注音频文件,通过音频预处理,得到若干个待标注语谱图片段;基于所述深度学习模型,将所述待标注语谱图片段进行音频标注。本发明利用卷积神经网络训练音频深度学习网络,实现音频自动化标注方法,相比于传统的人工标注方式,提高了标注准确率,提升了音频标注效率。 |
