多语种语音解码图的构建方法、装置、服务器和介质
基本信息

| 申请号 | CN201811643641.3 | 申请日 | - |
| 公开(公告)号 | CN109616096B | 公开(公告)日 | 2022-01-04 |
| 申请公布号 | CN109616096B | 申请公布日 | 2022-01-04 |
| 分类号 | G10L15/02(2006.01)I;G10L15/06(2013.01)I;G10L15/14(2006.01)I;G10L15/18(2013.01)I;G10L15/26(2006.01)I | 分类 | 乐器;声学; |
| 发明人 | 何金来;韩虎;雷宇 | 申请(专利权)人 | 北京儒博科技有限公司 |
| 代理机构 | 北京品源专利代理有限公司 | 代理人 | 孟金喆 |
| 地址 | 100089 北京市海淀区羊坊店路18号2幢3层301-112 | ||
| 法律状态 | - | ||
摘要

| 摘要 | 本发明实施例公开了一种多语种语音解码图的构建方法、装置、服务器和介质,涉及语音识别技术领域。所述方法包括:对样本语料库中包括的主语种词语和次语种词语进行标音,得到主语种词语和次语种词语的发音音素;根据所述样本语料库中的样本语料关联的样本语音,确定主语种词语和次语种词语的声学特征;根据所述样本语料库中的样本语料中包括的主语种词语和次语种词语,主语种词语和次语种词语的发音音素以及声学特征,确定用于多语种识别的解码图。本发明实施例通过根据样本语料库,得到主语种词语和次语种词语发音因素,进而确定其相关联的声学特性,最终获得用于多语种识别的解码图,实现了对多语种混读人群进行语音识别的需求。 |





