用于说话人识别的多背景模型建立方法
基本信息
申请号 | CN201010118149.1 | 申请日 | - |
公开(公告)号 | CN101833951B | 公开(公告)日 | 2011-11-09 |
申请公布号 | CN101833951B | 申请公布日 | 2011-11-09 |
分类号 | G10L15/06(2006.01)I;G10L15/02(2006.01)I | 分类 | 乐器;声学; |
发明人 | 张卫强;刘加 | 申请(专利权)人 | 北京华控创为信息技术有限公司 |
代理机构 | 北京众合诚成知识产权代理有限公司 | 代理人 | 清华大学;北京华控创为信息技术有限公司 |
地址 | 100084 北京市100084-82信箱 | ||
法律状态 | - |
摘要
摘要 | 用于说话人识别的多背景模型建立方法涉及一种说话人识别中背景模型建模方法,其特征在于所述方法首先根据语音的声道长度弯折系数对训练数据进行划分,每组数据分别训练UBM模型,然后由每个背景模型自适应得到目标说话人GMM模型,得到多组GMM和UBM模型,说话人识别时对测试数据,由每组GMM和UBM模型计算对数似然比分数,最后从中选取最小的一个作为分数输出。本发明可对背景模型进行细致刻画,从而提高说话人识别的准确率。 |
