一种利用神经网络的语音活性检测方法
基本信息
申请号 | CN202110979720.7 | 申请日 | - |
公开(公告)号 | CN113421595A | 公开(公告)日 | 2021-09-21 |
申请公布号 | CN113421595A | 申请公布日 | 2021-09-21 |
分类号 | G10L25/81(2013.01)I;G10L25/84(2013.01)I;G10L25/30(2013.01)I;G06K9/62(2006.01)I;G06N3/04(2006.01)I;G06N3/08(2006.01)I | 分类 | 乐器;声学; |
发明人 | 万东琴;胡岸;刘文通;曾帆 | 申请(专利权)人 | 成都启英泰伦科技有限公司 |
代理机构 | - | 代理人 | - |
地址 | 610041四川省成都市高新区天府五街200号菁蓉汇4号楼A座12层 | ||
法律状态 | - |
摘要
摘要 | 一种利用神经网络的语音活性检测方法,包括模型训练过程和语音活性检测过程;所述模型训练过程包括以下步骤:S1.对用于训练的纯净语音确定端点检测标签;S2.对纯净语音进行随机加噪,构造训练集;S3.逐帧处理,提取训练集中的多阶多分辨率耳蜗图特征向量;S4.构建多层门控制循环单元网络,利用训练集对其进行训练,得到多层门控制循环单元成熟模型,利用成熟模型进行语音活性检测。本发明利用神经网络良好的分类性能,提取带噪语音的特定特征,并通过预先训练好的神经网络模型,对语音以及噪声进行初步分类并求得一个语音存在概率;通过状态机对获得的语音存在概率进行后处理,从而得到一个平滑且相对准确的语音活性检测标识。 |
