一种音色分类方法、装置、设备和介质
基本信息
申请号 | CN202011565974.6 | 申请日 | - |
公开(公告)号 | CN112712820A | 公开(公告)日 | 2021-04-27 |
申请公布号 | CN112712820A | 申请公布日 | 2021-04-27 |
分类号 | G10L25/24;G10L25/51;G10L25/30;G06K9/62;G06K9/46;G06N3/04;G06N3/08 | 分类 | 乐器;声学; |
发明人 | 汪暾;马金龙;熊佳;罗箫;焦南凯;徐志坚;谢睿;陈光尧 | 申请(专利权)人 | 广州欢城文化传媒有限公司 |
代理机构 | 北京集佳知识产权代理有限公司 | 代理人 | 王宝筠 |
地址 | 510000 广东省广州市天河区黄埔大道西122号之二1901房 | ||
法律状态 | - |
摘要
摘要 | 本申请公开了一种音色分类方法、装置、设备和介质,方法包括:获取待分类音频文件;提取待分类音频文件的第一特征参数和第二特征参数;对待分类音频文件的第一特征参数和第二特征参数进行特征融合,并将融合后得到的特征参数转换为图像,得到待分类图像;将待分类图像输入到预置卷积神经网络模型进行音色分类,输出待分类音频文件的音色分类结果。本申请解决了现有技术通过提取单一特征参数进行音色分类,存在对于某一特定的音色分类任务,很难通过单一特征参数对不同类别音色进行有效区分,以及面对语调语速发生变化或者出现噪音干扰时,容易发生误分类的情况,导致音色分类准确率较低的技术问题。 |
