一种基于神经网络VAD算法的人机交互方法

基本信息

申请号 CN202110410397.1 申请日 -
公开(公告)号 CN113160816A 公开(公告)日 2021-07-23
申请公布号 CN113160816A 申请公布日 2021-07-23
分类号 G10L15/22;G10L15/16;G10L21/0232;G06N3/08;G06N3/04 分类 乐器;声学;
发明人 徐闽兆龙 申请(专利权)人 万蚓网络科技(上海)有限公司
代理机构 上海翰信知识产权代理事务所(普通合伙) 代理人 张维东
地址 200082 上海市杨浦区长阳路2588号2幢2层(集中登记地)
法律状态 -

摘要

摘要 本发明涉及一种基于神经网络VAD算法的人机交互方法,包括以下步骤:对输入的音频信号进行预加载,保留有效的音频段;对所述音频段进行数字化处理,并对所述数字化处理后的音频数字进行分帧和加窗操作;把加窗操作后的音频数字作为新的样本放入样本集进行训练,采用神经网络和人机交互结果自动调整VAD参数;将调整好的VAD参数运用于神经网络VAD算法,并读取加窗后的音频数字,以读取语音数据;对读取到的语音数据进行降噪处理和频域滤波处理;得到人机交互的输出结果。本发明通过神经网络把新的音频数字作为新的样本放入样本集进行训练,在大量通话和相同背景下,结合利用人机交互的输出结果纠正VAD参数,从而不断优化VAD参数,以不断优化人机交互质量。