语音数据标注方法和装置,电子设备

基本信息

申请号 CN202110051112.X 申请日 -
公开(公告)号 CN112863493A 公开(公告)日 2021-05-28
申请公布号 CN112863493A 申请公布日 2021-05-28
分类号 G10L15/183(2013.01)I;G10L15/06(2013.01)I;G10L15/02(2006.01)I 分类 乐器;声学;
发明人 肖娜;张欢;郭佳;武卫东 申请(专利权)人 北京捷通数智科技有限公司
代理机构 北京润泽恒知识产权代理有限公司 代理人 莎日娜
地址 100193北京市海淀区东北旺北京中关村软件园孵化器2号楼一层2115室
法律状态 -

摘要

摘要 本发明提供了一种语音数据标注方法和装置以及电子设备,其中,所述方法包括:将语音数据和文本输入预先训练的声学模型中,得到每帧语音针对音素的后验概率以及对齐结果;根据所述对齐结果,确定每个音素对应的各第一语音帧;针对所述文本中的每个音素,依据所述第一语音帧针对所述音素的后验概率,确定所述音素是否为存疑音素;在所述文本中对各所述存疑音素进行第一标记。本发明提供的语音数据标注方法,既可提升人工语音数据标注结果的准确度,有能够节省人工进行语音数据标注的人力消耗。