一种跨场景快速适应的语音识别方法和装置
基本信息
申请号 | CN202010305374.X | 申请日 | - |
公开(公告)号 | CN111477211A | 公开(公告)日 | 2020-07-31 |
申请公布号 | CN111477211A | 申请公布日 | 2020-07-31 |
分类号 | G10L15/02(2006.01)I | 分类 | - |
发明人 | 李新宇 | 申请(专利权)人 | 珠海声原智能科技有限公司 |
代理机构 | 北京汇彩知识产权代理有限公司 | 代理人 | 珠海声原智能科技有限公司 |
地址 | 519000广东省珠海市香洲区吉大景山路莲山巷8号8楼A802单元 | ||
法律状态 | - |
摘要
摘要 | 本发明提出一种跨场景快速适应的语音识别方法和装置,通过通用数据在不同场景的真实录放,真实大规模生成场景训练语音数据,从而达到对场景的快速语音适应,具有快速、低成本和高效的优势,助力语音识别多场景的落地应用。包括以下步骤:首先选取满足要求的基础语音;然后将选取的基础语音在需要适应的场景中进行场景语音生成,通过高保真放音设备进行基础语音播放,用拾音设备进行录取;再对录制的场景语音进行标注,通过基础语音的标注信息进行场景录制语音对齐,生成真实场景的场景标注语音;最后采用深度神经网络进行场景语音自适应训练,达到场景语音识别的要求。 |
