一种长语音标注装置及方法

基本信息

申请号 CN201911018547.3 申请日 -
公开(公告)号 CN110738986A 公开(公告)日 2020-01-31
申请公布号 CN110738986A 申请公布日 2020-01-31
分类号 G10L15/02;G10L15/06;G10L25/24;G10L25/30;G10L25/78;G10L25/87 分类 乐器;声学;
发明人 王丽媛 申请(专利权)人 数据堂(北京)智能科技有限公司
代理机构 北京集佳知识产权代理有限公司 代理人 数据堂(北京)智能科技有限公司
地址 100190 北京市海淀区中关村大街18号B座1805室
法律状态 -

摘要

摘要 本发明提供一种长语音标注装置及方法,以对长语音进行标注得到有效语音段落。在本发明实施例中,对长语音进行预处理得到语音信号后,会使用初始标注网络对语音帧进行初始标注,得到初始标注结果,再使用标注修正网络以模拟人工纠错的行为对初始标注结果进行修正(修正类型体现了对初始标注结果所进行的修正),在一定程度上减少了标注误差,然后再由标注决策子单元决策每一语音帧的最终标注结果(有效语音帧或无效语音帧)。由于有效语音段落包括连接多个有效语音帧,因此,在确定每一语音帧是有效语音帧或无效语音帧后,有效语音段落也会确定下来,从而实现了对长语音的标注。