一种语音建模方法及装置
基本信息
申请号 | CN201811390640.2 | 申请日 | - |
公开(公告)号 | CN109243429A | 公开(公告)日 | 2019-01-18 |
申请公布号 | CN109243429A | 申请公布日 | 2019-01-18 |
分类号 | G10L15/14;G10L15/02;G10L25/24 | 分类 | 乐器;声学; |
发明人 | 唐浩元;王佳珺;王欢良;马殿昌 | 申请(专利权)人 | 苏州奇梦者科技有限公司 |
代理机构 | 苏州国诚专利代理有限公司 | 代理人 | 苏州奇梦者网络科技有限公司 |
地址 | 215024 江苏省苏州市工业园区若水路388号纳米技术国家大学科技园E栋1604 | ||
法律状态 | - |
摘要
摘要 | 本发明涉及一种语音建模方法及装置,所述方法包括:获取在简单场景下录制的第一语音信号;获取所述第一语音信号的第一音素对齐序列;向所述第一语音信号添加信道畸变、混响和噪声,生成仿真语音信号;对所述仿真语音信号中的非语音段进行分类,并对每一类分别建立对应的一个用于建模的目标音素;根据所述仿真语音信号中的噪声类别,将所述仿真语音信号中的第二音素对齐序列中的非语音段噪声音素分别替换成对应的所述目标音素;其中,所述第二音素对齐序列与所述第一音素对齐序列相同;基于替换后的所述仿真语音信号生成目标声学模型。本发明可以提高在目标复杂场景下的语音识别性能。 |
