一种基于音素对数似然比的时延神经网络的声纹识别方法

基本信息

申请号 CN202110752463.3 申请日 -
公开(公告)号 CN113470655A 公开(公告)日 2021-10-01
申请公布号 CN113470655A 申请公布日 2021-10-01
分类号 G10L17/02(2013.01)I;G10L17/18(2013.01)I;G10L17/20(2013.01)I 分类 乐器;声学;
发明人 刘俊南;薛辉;缪蔚;郭鹏;齐心 申请(专利权)人 因诺微科技(天津)有限公司
代理机构 天津诺德知识产权代理事务所(特殊普通合伙) 代理人 朱卉
地址 300000天津市滨海新区华苑产业区(环外)海泰发展五道16号B-6号楼-1-502
法律状态 -

摘要

摘要 一种基于音素对数似然比的时延神经网络的声纹识别方法,所述方法包括步骤:获取语音数据;对所述语音数据进行预处理;使用音素识别器对预处理后的所述语音数据提取音素后验概率向量;使用预处理后的所述语音数据训练时延神经网络并提取X‑vector辨别矢量;使用所述音素后验概率向量训练混合高斯模型‑通用背景模型;使用所述混合高斯模型‑通用背景模型计算I‑vector辨别矢量;消除I‑vector特征空间中信道信息影响;使用所述X‑vector辨别矢量和所述I‑vector辨别矢量生成新分类器;将X‑vector特征和I‑vector特征输入所述新分类器;获取所述新分类器的声纹信息输出。本申请能够对声纹的信息进行快速准确的识别,提升系统的鲁棒性,且可以跨平台使用。