一种多通道远场语音识别方法

基本信息

申请号 CN201810986855.4 申请日 -
公开(公告)号 CN110867178B 公开(公告)日 2022-01-21
申请公布号 CN110867178B 申请公布日 2022-01-21
分类号 G10L15/02(2006.01)I;G10L15/06(2013.01)I;G10L15/26(2006.01)I;G10L25/03(2013.01)I;G10L25/30(2013.01)I 分类 乐器;声学;
发明人 张鹏远;李文洁;潘接林;颜永红 申请(专利权)人 北京中科信利技术有限公司
代理机构 北京方安思达知识产权代理有限公司 代理人 陈琳琳;刘振
地址 100190北京市海淀区北四环西路21号
法律状态 -

摘要

摘要 本发明涉及一种多通道远场语音识别方法,其包括:步骤1)提取每个通道的远场语音信号的语音特征,串接多个通道的语音特征,获得语音特征向量;步骤2)计算任意两个通道之间的GCC特征,将GCC特征与步骤1)获得的语音特征向量拼接,获得远场特征向量,作为训练远场学生模型的训练数据;步骤3)对专家模型进行训练,获得训练后的专家模型;同时采用知识升华策略,对远场学生模型进行训练,获得训练后的远场学生模型;步骤4)将待识别语音信号的特征和GCC特征拼接,获得拼接后的特征向量,并将其输入至训练后的远场学生模型,获得对应的远场后验概率向量,进而得到对应的后验概率值,再经过维特比解码,对待识别的语音信号进行识别。