一种利用神经网络的语音活性检测方法

基本信息

申请号 CN202110979720.7 申请日 -
公开(公告)号 CN113421595A 公开(公告)日 2021-09-21
申请公布号 CN113421595A 申请公布日 2021-09-21
分类号 G10L25/81(2013.01)I;G10L25/84(2013.01)I;G10L25/30(2013.01)I;G06K9/62(2006.01)I;G06N3/04(2006.01)I;G06N3/08(2006.01)I 分类 乐器;声学;
发明人 万东琴;胡岸;刘文通;曾帆 申请(专利权)人 成都启英泰伦科技有限公司
代理机构 - 代理人 -
地址 610041四川省成都市高新区天府五街200号菁蓉汇4号楼A座12层
法律状态 -

摘要

摘要 一种利用神经网络的语音活性检测方法,包括模型训练过程和语音活性检测过程;所述模型训练过程包括以下步骤:S1.对用于训练的纯净语音确定端点检测标签;S2.对纯净语音进行随机加噪,构造训练集;S3.逐帧处理,提取训练集中的多阶多分辨率耳蜗图特征向量;S4.构建多层门控制循环单元网络,利用训练集对其进行训练,得到多层门控制循环单元成熟模型,利用成熟模型进行语音活性检测。本发明利用神经网络良好的分类性能,提取带噪语音的特定特征,并通过预先训练好的神经网络模型,对语音以及噪声进行初步分类并求得一个语音存在概率;通过状态机对获得的语音存在概率进行后处理,从而得到一个平滑且相对准确的语音活性检测标识。