一种音频标注方法及装置
基本信息
申请号 | CN201610866294.5 | 申请日 | - |
公开(公告)号 | CN107886941A | 公开(公告)日 | 2018-04-06 |
申请公布号 | CN107886941A | 申请公布日 | 2018-04-06 |
分类号 | G10L15/02;G10L15/06;G10L19/04;G10L13/08;G06F17/30 | 分类 | 乐器;声学; |
发明人 | 高玉敏;王志鹏 | 申请(专利权)人 | 亿览在线网络技术(北京)有限公司 |
代理机构 | 北京亿腾知识产权代理事务所 | 代理人 | 亿览在线网络技术(北京)有限公司 |
地址 | 100081 北京市海淀区知春路106号太平洋国际大厦写字楼9层905-906室 | ||
法律状态 | - |
摘要
摘要 | 本发明涉及一种音频标注方法及装置,方法包括:将音频文件切分成多个音频片段,并从中选取至少一个音频片段;提取至少一个音频片段的声学特征和图像特征,所述声学特征包括调性和/或频率分布特征;将至少一个音频片段中相同的音频片段的音频特征和图像特征进行合成,获得至少一个音频片段中相同的音频片段的特征向量;对至少一个音频片段的特征向量进行训练和预测,获得相应的概率分布,选择概率值中的最大值对应的标签作为音频文件的标签,解决了音频标注时耗费人力资源大、耗时长且标注准确率低的问题,实现了高效率高准确率的音频标注。 |
