一种跨场景快速适应的语音识别方法和装置

基本信息

申请号 CN202010305374.X 申请日 -
公开(公告)号 CN111477211A 公开(公告)日 2020-07-31
申请公布号 CN111477211A 申请公布日 2020-07-31
分类号 G10L15/02(2006.01)I 分类 -
发明人 李新宇 申请(专利权)人 珠海声原智能科技有限公司
代理机构 北京汇彩知识产权代理有限公司 代理人 珠海声原智能科技有限公司
地址 519000广东省珠海市香洲区吉大景山路莲山巷8号8楼A802单元
法律状态 -

摘要

摘要 本发明提出一种跨场景快速适应的语音识别方法和装置,通过通用数据在不同场景的真实录放,真实大规模生成场景训练语音数据,从而达到对场景的快速语音适应,具有快速、低成本和高效的优势,助力语音识别多场景的落地应用。包括以下步骤:首先选取满足要求的基础语音;然后将选取的基础语音在需要适应的场景中进行场景语音生成,通过高保真放音设备进行基础语音播放,用拾音设备进行录取;再对录制的场景语音进行标注,通过基础语音的标注信息进行场景录制语音对齐,生成真实场景的场景标注语音;最后采用深度神经网络进行场景语音自适应训练,达到场景语音识别的要求。