无损音频文件识别方法及装置
基本信息
申请号 | CN201610867517.X | 申请日 | - |
公开(公告)号 | CN107895571A | 公开(公告)日 | 2018-04-10 |
申请公布号 | CN107895571A | 申请公布日 | 2018-04-10 |
分类号 | G10L15/06;G10L15/16 | 分类 | 乐器;声学; |
发明人 | 赵岩 | 申请(专利权)人 | 亿览在线网络技术(北京)有限公司 |
代理机构 | 北京亿腾知识产权代理事务所 | 代理人 | 亿览在线网络技术(北京)有限公司 |
地址 | 100081 北京市海淀区知春路106号太平洋国际大厦写字楼9层905-906室 | ||
法律状态 | - |
摘要
摘要 | 本发明实施例涉及一种无损音频文件识别方法,其特征在于,包括:确定无损音频文件样本集以及有损音频文件样本集;将无损音频文件样本集以及有损音频文件样本集分别转换成无损音频声谱图样本集以及有损音频声谱图样本集;按照相同的缩放比例,分别对无损音频声谱图样本集以及有损音频声谱图样本集进行压缩;利用卷积神经网络学习算法对压缩后的无损音频声谱图样本集以及压缩后的有损音频声谱图样本集进行训练,得到识别模型;确定待识别的音频文件,根据模型对待识别的音频文件进行识别。由此,可以实现提高无损音频识别的准确率,提升用户体验。 |
