一种多通道远场语音识别方法
基本信息
申请号 | CN201810986855.4 | 申请日 | - |
公开(公告)号 | CN110867178B | 公开(公告)日 | 2022-01-21 |
申请公布号 | CN110867178B | 申请公布日 | 2022-01-21 |
分类号 | G10L15/02(2006.01)I;G10L15/06(2013.01)I;G10L15/26(2006.01)I;G10L25/03(2013.01)I;G10L25/30(2013.01)I | 分类 | 乐器;声学; |
发明人 | 张鹏远;李文洁;潘接林;颜永红 | 申请(专利权)人 | 北京中科信利技术有限公司 |
代理机构 | 北京方安思达知识产权代理有限公司 | 代理人 | 陈琳琳;刘振 |
地址 | 100190北京市海淀区北四环西路21号 | ||
法律状态 | - |
摘要
摘要 | 本发明涉及一种多通道远场语音识别方法,其包括:步骤1)提取每个通道的远场语音信号的语音特征,串接多个通道的语音特征,获得语音特征向量;步骤2)计算任意两个通道之间的GCC特征,将GCC特征与步骤1)获得的语音特征向量拼接,获得远场特征向量,作为训练远场学生模型的训练数据;步骤3)对专家模型进行训练,获得训练后的专家模型;同时采用知识升华策略,对远场学生模型进行训练,获得训练后的远场学生模型;步骤4)将待识别语音信号的特征和GCC特征拼接,获得拼接后的特征向量,并将其输入至训练后的远场学生模型,获得对应的远场后验概率向量,进而得到对应的后验概率值,再经过维特比解码,对待识别的语音信号进行识别。 |
