一种基于深度学习的音频自动化标注方法

基本信息

申请号 CN201810050808.9 申请日 -
公开(公告)号 CN108053836B 公开(公告)日 2021-03-23
申请公布号 CN108053836B 申请公布日 2021-03-23
分类号 G06F16/61(2019.01)I;G10L25/48(2013.01)I;G10L25/30(2013.01)I;G10L25/03(2013.01)I;G06F16/683(2019.01)I 分类 乐器;声学;
发明人 尹学渊;江天宇 申请(专利权)人 成都嗨翻屋科技有限公司
代理机构 四川力久律师事务所 代理人 刘童笛
地址 610000四川省成都市中国(四川)自由贸易试验区成都高新区益州大道中段722号1幢1单元12层1201号
法律状态 -

摘要

摘要 本发明涉及一种音频标注方法,特别涉及一种基于深度学习的音频自动化标注方法。一种基于深度学习的音频自动化标注方法,包括以下实现步骤:输入原始音频文件,通过音频预处理,得到若干个原始语谱图片段;将所述原始语谱图片段输入卷积神经网络中进行训练,构建深度学习模型;输入待标注音频文件,通过音频预处理,得到若干个待标注语谱图片段;基于所述深度学习模型,将所述待标注语谱图片段进行音频标注。本发明利用卷积神经网络训练音频深度学习网络,实现音频自动化标注方法,相比于传统的人工标注方式,提高了标注准确率,提升了音频标注效率。