一种语音识别方法、装置和电子设备

基本信息

申请号 CN202011294806.8 申请日 -
公开(公告)号 CN112420050B 公开(公告)日 2021-06-18
申请公布号 CN112420050B 申请公布日 2021-06-18
分类号 G10L15/26;G10L15/14;G10L15/16 分类 乐器;声学;
发明人 易中华 申请(专利权)人 北京帝派智能科技有限公司
代理机构 北京弘权知识产权代理有限公司 代理人 郭放;许伟群
地址 100080 北京市海淀区海淀大街34号8层820室
法律状态 -

摘要

摘要 本申请实施例提供了一种语音识别方法、装置和电子设备,能够使用声学模型生成第一语音数据对应的第一声学表征;使用第一语音数据对应的第一文本数据和第一声学表征训练数据生成器模型,以使数据生成器模型用于根据任意文本数据生成对应的声学表征;使用数据生成器模型生成第二文本数据对应的第二声学表征,第二文本数据的规模大于第一文本数据;使用第二文本数据和第二声学表征训练语言模型,以使语言模型用于根据声学模型输出的声学表征生成对应的文本序列。本申请实施例的技术方案,通过数据生成器模型增大了声学表征的规模,使得训练得到的语音识别系统可以应用于大词汇量连续语音识别的场景中,并且具有较高的准确性。