一种音色分类方法、装置、设备和介质

基本信息

申请号 CN202011565974.6 申请日 -
公开(公告)号 CN112712820A 公开(公告)日 2021-04-27
申请公布号 CN112712820A 申请公布日 2021-04-27
分类号 G10L25/24;G10L25/51;G10L25/30;G06K9/62;G06K9/46;G06N3/04;G06N3/08 分类 乐器;声学;
发明人 汪暾;马金龙;熊佳;罗箫;焦南凯;徐志坚;谢睿;陈光尧 申请(专利权)人 广州欢城文化传媒有限公司
代理机构 北京集佳知识产权代理有限公司 代理人 王宝筠
地址 510000 广东省广州市天河区黄埔大道西122号之二1901房
法律状态 -

摘要

摘要 本申请公开了一种音色分类方法、装置、设备和介质,方法包括:获取待分类音频文件;提取待分类音频文件的第一特征参数和第二特征参数;对待分类音频文件的第一特征参数和第二特征参数进行特征融合,并将融合后得到的特征参数转换为图像,得到待分类图像;将待分类图像输入到预置卷积神经网络模型进行音色分类,输出待分类音频文件的音色分类结果。本申请解决了现有技术通过提取单一特征参数进行音色分类,存在对于某一特定的音色分类任务,很难通过单一特征参数对不同类别音色进行有效区分,以及面对语调语速发生变化或者出现噪音干扰时,容易发生误分类的情况,导致音色分类准确率较低的技术问题。