语音标注质量确定方法、装置、设备及计算机可读介质

基本信息

申请号 CN201910693573.X 申请日 -
公开(公告)号 CN110264996B 公开(公告)日 2021-12-17
申请公布号 CN110264996B 申请公布日 2021-12-17
分类号 G10L15/01(2013.01)I;G10L15/26(2006.01)I;G10L15/06(2013.01)I;G06K9/62(2006.01)I;G06F16/35(2019.01)I 分类 乐器;声学;
发明人 张晴晴;何淑琳;刘天宇;杨金富;罗磊;马光谦;汪洋 申请(专利权)人 北京爱数智慧科技有限公司
代理机构 北京智沃律师事务所 代理人 梁晨
地址 100044北京市海淀区高梁桥斜街59号院1号楼14层1415
法律状态 -

摘要

摘要 本申请涉及一种语音标注质量确定方法、装置、设备及计算机可读介质。所述方法包括将目标音频文件输入预设的语音识别模型中,得到预识别文本及所述预识别文本的贝叶斯风险值;获取标注员对所述预识别文本在标注过程中的标注过程信息及所述标注员在标注历史标注文本时的历史标注信息;基于所述贝叶斯风险值、所述标注过程信息及历史标注信息确定所述标注员对所述预识别文本进行标注的得到的标注文本的文本可信度;根据所述文本可信度确定所述标注文本的标注质量。本申请能够实现辅助验收员关注更可能出错的标注文本,进而提升整个语音数据标注质检的效率。