一种基于人工智能的声纹特征提取方法及装置
基本信息
申请号 | CN202110267332.6 | 申请日 | - |
公开(公告)号 | CN112786059A | 公开(公告)日 | 2021-05-11 |
申请公布号 | CN112786059A | 申请公布日 | 2021-05-11 |
分类号 | G10L17/04;G10L17/18;G10L17/02 | 分类 | 乐器;声学; |
发明人 | 徐琼;程铖;谢根;汪贵旗;聂亚子 | 申请(专利权)人 | 合肥市清大创新研究院有限公司 |
代理机构 | 上海精晟知识产权代理有限公司 | 代理人 | 李佼佼 |
地址 | 230000 安徽省合肥市合肥高新技术开发区创新大道2800号创新产业园二期J2区C座2318室 | ||
法律状态 | - |
摘要
摘要 | 本发明公开了一种基于人工智能的声纹特征提取方法及装置。本发明包括如下步骤:采集语音数据和非语音数据,建立样本数据库;从样本数据库中取一音频文件,进行处理得到音频帧序列;对音频帧序列中每一帧进行傅里叶变化,得到该帧对应的频谱图信息;将时域信息和频域信息进行提取,得到时域特征和频域特征;将时域特征和频域特征进行特征聚合,得到聚合后的特征;对聚合后的特征进行向量嵌入,得到声纹特征向量;将声纹特征向量输入至卷积神经网络模型进行训练,得到声纹特征模型;获取待识别语音数据进行预处理;从预处理后的语音特征数据输入声纹特征模型得到语音特征向量。本发明提高了声纹特征提取的准确率和效率。 |
