用音频特征主成分建立的语音群集来识别说话人的方法专利查询专利号|摘要-满商公司网

用音频特征主成分建立的语音群集来识别说话人的方法

基本信息

摘要

摘要	本发明公开了一种用音频特征主成分建立的语音群集来识别说话人的方法，该方法是将主成分分析和基于音频特征在主分量空间中的欧几里得距离的层次聚类相结合，具体为：收集不同的训练音频样本集；计算每个样本的时域和频域音频特征；计算出时域和频域音频特征的平均值和标准偏差；通过计算出的数据对训练样本进行主成分分析；将每个音频由音频特征数据沿着上述N个主成分投影的坐标来代表；采用UPGMA聚类分析算法，基于n维空间中的距离对说话人进行聚类。本发明的方法具有速度快，添加新说话人语音方便的特点，用于智能语言教学系统，实现了说话人识别，从未知的多个发言者会话中及时分辨说话人，利于针对性的教学。