语音数据标注方法和装置,电子设备
基本信息
申请号 | CN202110051112.X | 申请日 | - |
公开(公告)号 | CN112863493A | 公开(公告)日 | 2021-05-28 |
申请公布号 | CN112863493A | 申请公布日 | 2021-05-28 |
分类号 | G10L15/183(2013.01)I;G10L15/06(2013.01)I;G10L15/02(2006.01)I | 分类 | 乐器;声学; |
发明人 | 肖娜;张欢;郭佳;武卫东 | 申请(专利权)人 | 北京捷通数智科技有限公司 |
代理机构 | 北京润泽恒知识产权代理有限公司 | 代理人 | 莎日娜 |
地址 | 100193北京市海淀区东北旺北京中关村软件园孵化器2号楼一层2115室 | ||
法律状态 | - |
摘要
摘要 | 本发明提供了一种语音数据标注方法和装置以及电子设备,其中,所述方法包括:将语音数据和文本输入预先训练的声学模型中,得到每帧语音针对音素的后验概率以及对齐结果;根据所述对齐结果,确定每个音素对应的各第一语音帧;针对所述文本中的每个音素,依据所述第一语音帧针对所述音素的后验概率,确定所述音素是否为存疑音素;在所述文本中对各所述存疑音素进行第一标记。本发明提供的语音数据标注方法,既可提升人工语音数据标注结果的准确度,有能够节省人工进行语音数据标注的人力消耗。 |
