一种基于三元组的语音识别准确率计算方法

基本信息

申请号 CN202110026253.6 申请日 -
公开(公告)号 CN112349290B 公开(公告)日 2021-04-20
申请公布号 CN112349290B 申请公布日 2021-04-20
分类号 G06F16/35(2019.01)I;G06F40/205(2020.01)I;G10L15/26(2006.01)I;G06F40/30(2020.01)I;G10L25/69(2013.01)I;G06F40/279(2020.01)I;G06N3/04(2006.01)I 分类 乐器;声学;
发明人 杜沪;邵志明;宋琼;李科;郝玉峰;黄宇凯 申请(专利权)人 北京海天瑞声科技股份有限公司
代理机构 北京钲霖知识产权代理有限公司 代理人 李志新;刘亚平
地址 100083北京市海淀区成府路28号优盛大厦D801
法律状态 -

摘要

摘要 本公开是关于一种基于三元组的语音识别准确率计算方法及装置、电子设备和计算机可读存储介质。其中,方法包括:获取待识别语音及语音对应的正确文本;识别语音,得到识别文本;标注识别文本及正确文本;解析标注的识别文本及正确文本,获得识别文本的三元组序列及正确文本的三元组序列;根据识别文本的三元组序列及正确文本的三元组序列计算识别准确率。一方面,对文本进行标注,可以有效划分出会影响语音识别准确率的词语;另一方面,将语音识别结果与正确答案统一转化为三元组形式,进一步丰富词语的语义信息,减少因识别引擎识别结果格式的不同导致准确率统计上的偏差,从而对语音识别引擎的改进提供质量控制依据。