一种发音识别方法及装置
基本信息
申请号 | CN201811534881.X | 申请日 | - |
公开(公告)号 | CN109697976A | 公开(公告)日 | 2019-04-30 |
申请公布号 | CN109697976A | 申请公布日 | 2019-04-30 |
分类号 | G10L15/02(2006.01)I; G10L15/06(2013.01)I; G10L15/25(2013.01)I; G10L15/26(2006.01)I | 分类 | 乐器;声学; |
发明人 | 佟子健; 张俊博 | 申请(专利权)人 | 北京葡萄智学科技有限公司 |
代理机构 | 北京润泽恒知识产权代理有限公司 | 代理人 | 莎日娜 |
地址 | 100080 北京市海淀区北四环西路9号9层908 | ||
法律状态 | - |
摘要
摘要 | 本发明实施例提供了一种发音识别方法及装置,方法包括:获取包括发音对象的目标视频;通过预设发音识别模型同步识别所述目标视频的第一特征信息和第二特征信息,得到所述发音对象的发音结果。本发明实施例获取包括发音对象的目标视频后,通过预设发音识别模型对目标视频的第一特征信息和第二特征信息进行同步识别,因为识别的过程中第一特征信息和第二特征信息可以互相补充,且同步识别的过程中不会发生对齐错位,因此,本发明实施例相对于现有技术的三种发音识别方法均能得到更加准确的发音结果。 |
