一种基于人工智能的声纹特征提取方法及装置

基本信息

申请号 CN202110267332.6 申请日 -
公开(公告)号 CN112786059A 公开(公告)日 2021-05-11
申请公布号 CN112786059A 申请公布日 2021-05-11
分类号 G10L17/04;G10L17/18;G10L17/02 分类 乐器;声学;
发明人 徐琼;程铖;谢根;汪贵旗;聂亚子 申请(专利权)人 合肥市清大创新研究院有限公司
代理机构 上海精晟知识产权代理有限公司 代理人 李佼佼
地址 230000 安徽省合肥市合肥高新技术开发区创新大道2800号创新产业园二期J2区C座2318室
法律状态 -

摘要

摘要 本发明公开了一种基于人工智能的声纹特征提取方法及装置。本发明包括如下步骤:采集语音数据和非语音数据,建立样本数据库;从样本数据库中取一音频文件,进行处理得到音频帧序列;对音频帧序列中每一帧进行傅里叶变化,得到该帧对应的频谱图信息;将时域信息和频域信息进行提取,得到时域特征和频域特征;将时域特征和频域特征进行特征聚合,得到聚合后的特征;对聚合后的特征进行向量嵌入,得到声纹特征向量;将声纹特征向量输入至卷积神经网络模型进行训练,得到声纹特征模型;获取待识别语音数据进行预处理;从预处理后的语音特征数据输入声纹特征模型得到语音特征向量。本发明提高了声纹特征提取的准确率和效率。