一种基于音素对数似然比的时延神经网络的声纹识别方法
基本信息
申请号 | CN202110752463.3 | 申请日 | - |
公开(公告)号 | CN113470655A | 公开(公告)日 | 2021-10-01 |
申请公布号 | CN113470655A | 申请公布日 | 2021-10-01 |
分类号 | G10L17/02(2013.01)I;G10L17/18(2013.01)I;G10L17/20(2013.01)I | 分类 | 乐器;声学; |
发明人 | 刘俊南;薛辉;缪蔚;郭鹏;齐心 | 申请(专利权)人 | 因诺微科技(天津)有限公司 |
代理机构 | 天津诺德知识产权代理事务所(特殊普通合伙) | 代理人 | 朱卉 |
地址 | 300000天津市滨海新区华苑产业区(环外)海泰发展五道16号B-6号楼-1-502 | ||
法律状态 | - |
摘要
摘要 | 一种基于音素对数似然比的时延神经网络的声纹识别方法,所述方法包括步骤:获取语音数据;对所述语音数据进行预处理;使用音素识别器对预处理后的所述语音数据提取音素后验概率向量;使用预处理后的所述语音数据训练时延神经网络并提取X‑vector辨别矢量;使用所述音素后验概率向量训练混合高斯模型‑通用背景模型;使用所述混合高斯模型‑通用背景模型计算I‑vector辨别矢量;消除I‑vector特征空间中信道信息影响;使用所述X‑vector辨别矢量和所述I‑vector辨别矢量生成新分类器;将X‑vector特征和I‑vector特征输入所述新分类器;获取所述新分类器的声纹信息输出。本申请能够对声纹的信息进行快速准确的识别,提升系统的鲁棒性,且可以跨平台使用。 |
