一种基于张量子空间分析的说话人识别方法及其装置专利查询专利号|摘要-满商公司网

一种基于张量子空间分析的说话人识别方法及其装置

基本信息

摘要

摘要	本发明涉及自动语音识别领域，特别是一种基于张量子空间分析的说话人识别方法和装置。该方法包括：通过语音数据，训练通用背景高斯混合模型和通用投影矩阵。随后，利用训练好的通用模型和目标说话人的语音建立说话人模型。最后，计算目标说话人模型和测试语音的低维嵌入矩阵的相关系数，并依此作为说话人识别的依据。该装置包括：语音预处理模块、特征提取模块、训练通用背景高斯混合模型模块、自适应模块、训练通用投影矩阵模块、计算低维嵌入模块、计算相关系数模块、分数判决模块和存储模块。本发明能够明显降低说话人建模时的运算量，并且具有模型自由度低、鲁棒性强等特点，适用于语音长度有限情况下的文本无关说话人识别。