一种闽南语语音识别方法、系统、设备及介质

基本信息

申请号 CN202110615995.2 申请日 -
公开(公告)号 CN113571045A 公开(公告)日 2021-10-29
申请公布号 CN113571045A 申请公布日 2021-10-29
分类号 G10L15/02(2006.01)I;G10L15/06(2013.01)I;G10L15/00(2013.01)I;G10L25/27(2013.01)I 分类 乐器;声学;
发明人 欧智坚;刘岩;肖吉;孙磊 申请(专利权)人 北京它思智能科技有限公司
代理机构 北京动力号知识产权代理有限公司 代理人 董钢
地址 100089北京市海淀区王庄路1号院清华同方科技大厦D座21层
法律状态 -

摘要

摘要 本发明公开了一种闽南语语音识别方法、系统、设备及介质,使用普通话音素作为建模单元对闽南语进行识别,相较于传统的使用闽南语音素作为建模单元,大幅减少了音素序列的数量,降低了基于音素的n‑gram语言模型的复杂度,降低了工作量,从而提高了建模效率;同时,在目标函数中引入条件随机场CRF,CTC的状态后验可以看作是条件随机场的点势能,状态与状态之间的联系可以通过边势能引入,改善了词错误率水平,提高了声学模型的性能,从而提高了识别准确率。