一种基于音素对数似然比的时延神经网络的声纹识别方法专利查询专利号|摘要-满商公司网

一种基于音素对数似然比的时延神经网络的声纹识别方法

基本信息

申请号	CN202110752463.3	申请日	-
公开（公告）号	CN113470655A	公开（公告）日	2021-10-01
申请公布号	CN113470655A	申请公布日	2021-10-01
分类号	G10L17/02（2013.01）I;G10L17/18（2013.01）I;G10L17/20（2013.01）I	分类	乐器；声学;
发明人	刘俊南;薛辉;缪蔚;郭鹏;齐心	申请（专利权）人	因诺微科技（天津）有限公司
代理机构	天津诺德知识产权代理事务所（特殊普通合伙）	代理人	朱卉
地址	300000天津市滨海新区华苑产业区（环外）海泰发展五道16号B-6号楼-1-502
法律状态	-

摘要

一种基于音素对数似然比的时延神经网络的声纹识别方法，所述方法包括步骤：获取语音数据；对所述语音数据进行预处理；使用音素识别器对预处理后的所述语音数据提取音素后验概率向量；使用预处理后的所述语音数据训练时延神经网络并提取X‑vector辨别矢量；使用所述音素后验概率向量训练混合高斯模型‑通用背景模型；使用所述混合高斯模型‑通用背景模型计算I‑vector辨别矢量；消除I‑vector特征空间中信道信息影响；使用所述X‑vector辨别矢量和所述I‑vector辨别矢量生成新分类器；将X‑vector特征和I‑vector特征输入所述新分类器；获取所述新分类器的声纹信息输出。本申请能够对声纹的信息进行快速准确的识别，提升系统的鲁棒性，且可以跨平台使用。