人声激活检测方法、装置、计算机设备和存储介质
基本信息
申请号 | CN202110425564.X | 申请日 | - |
公开(公告)号 | CN113113001A | 公开(公告)日 | 2021-07-13 |
申请公布号 | CN113113001A | 申请公布日 | 2021-07-13 |
分类号 | G10L15/16(2006.01)I;G10L21/0272(2013.01)I | 分类 | 乐器;声学; |
发明人 | 徐泓洋;王广新;杨汉丹 | 申请(专利权)人 | 深圳市友杰智新科技有限公司 |
代理机构 | 深圳市明日今典知识产权代理事务所(普通合伙) | 代理人 | 王杰辉;曹勇 |
地址 | 518000广东省深圳市南山区招商街道蛇口南海大道1079号花园城数码大厦A座402 | ||
法律状态 | - |
摘要
摘要 | 本申请提供一种人声激活检测方法、装置、计算机设备和存储介质,其中方法包括:实时采集语音数据;提取所述语音数据中每一帧音频数据对应的语音特征向量;依序将预设帧音频数据对应的语音特征向量输入至预设的人声激活检测模型中;其中,所述预设的人声激活检测模型基于时延神经网络训练得到,输入的所述预设帧音频数据对应的语音特征向量包括当前帧及其上下文的多帧音频数据分别对应的语音特征向量;基于所述人声激活检测模型,检测所述预设帧音频数据中是否包括人声。本申请基于时延神经网络训练得到的人声激活检测模型检测人声,不仅检测速度快,且模型结合了当前帧及其上下文的语音,检测效果好。 |
