音频数据增强方法、装置、电子设备及存储介质

基本信息

申请号 CN202210666591.0 申请日 -
公开(公告)号 CN114758665A 公开(公告)日 2022-07-15
申请公布号 CN114758665A 申请公布日 2022-07-15
分类号 G10L21/02(2013.01)I;G10L25/84(2013.01)I;G10L15/06(2013.01)I 分类 乐器;声学;
发明人 郑鑫江;凌明;杨作兴;艾国 申请(专利权)人 深圳比特微电子科技有限公司
代理机构 北京德琦知识产权代理有限公司 代理人 -
地址 518000广东省深圳市南山区高新南六道航盛科技大厦801
法律状态 -

摘要

摘要 本公开涉及一种音频数据增强方法、装置、电子设备及存储介质,包括:确定音频识别任务,其中,音频识别任务为关键词检测任务和/或者声音事件检测任务;接收关联于音频识别任务的音频数据;根据音频识别任务,对音频数据进行拆分重组,获得针对音频识别任务的增强样本数据;根据增强样本数据和音频识别任务,得到针对音频识别任务的音频训练样本。本公开对音频数据进行拆分重组,所得到的音频训练样本具有针对关键词检测任务的更加突出的关键词特征或者针对声音事件检测任务的更加突出的声音特征,能够提升关键词检测任务的语音识别的准确性并缩短声音事件检测任务的检测响应时长,可改善关键词检测任务和/或声音事件检测任务的用户体验。