语音识别系统中的说话人自适应方法
基本信息
申请号 | CN03102206.5 | 申请日 | - |
公开(公告)号 | CN1221939C | 公开(公告)日 | 2005-10-05 |
申请公布号 | CN1221939C | 申请公布日 | 2005-10-05 |
分类号 | G10L15/00;G10L15/14;G10L15/06 | 分类 | 乐器;声学; |
发明人 | 吴及;王作英;吕萍 | 申请(专利权)人 | 北京长青智业科技发展有限公司 |
代理机构 | 北京万慧达知识产权代理有限公司 | 代理人 | 秦开宗 |
地址 | 100029北京市朝阳区裕民路12号中国国际科技会展中心A座1701号 | ||
法律状态 | - |
摘要
摘要 | 本发明提供了一种语音识别系统中的说话人自适应方法,称为最大高斯相似度协方差矩阵线性插值方法,能够克服基于高斯相似度的二叉决策树方法中在自适应数据极少的情况下的缺点。本发明主要步骤是:自适应前,首先与基于高斯相似度分析的二叉决策树自适应方法一样,根据非特定人模型建立起协方差矩阵二叉决策树;然后,按照该决策树计算在各特定人模型下中间节点对应的类中心矩阵。自适应时,先由测试者提供的数据量决定,在哪些中间节点上进行插值自适应,接着根据每一待插值的中间节点对应的自适应数据,计算插值系数,最后计算自适应后的类中心矩阵,更新协方差矩阵,得到自适应模型。 |
