一种基于姿态传感器的语音活动检测方法

基本信息

申请号 CN202110646290.7 申请日 -
公开(公告)号 CN113327589A 公开(公告)日 2021-08-31
申请公布号 CN113327589A 申请公布日 2021-08-31
分类号 G10L15/02(2006.01)I;G10L15/06(2013.01)I;G10L15/16(2006.01)I;G10L15/24(2013.01)I;G10L19/02(2013.01)I;G10L21/0232(2013.01)I;G10L25/18(2013.01)I 分类 乐器;声学;
发明人 王蒙;胡奎;姜黎 申请(专利权)人 杭州芯声智能科技有限公司
代理机构 成都知都云专利代理事务所(普通合伙) 代理人 赵正寅
地址 310000浙江省杭州市杭州经济技术开发区白杨街道科技园路20号14幢3层02室-15
法律状态 -

摘要

摘要 本发明提供的一种基于姿态传感器的语音活动检测方法,涉及人机交互技术领域。本发明通过将姿态特征数据与声音特征数据进行特征拼接,得到混合特征数据;通过混合特征数据对神经网络模型进行训练,能实现在不同姿态下对语音活动进行准确检测,解决了用户姿态会影响语音活动检测准确度的问题;通过量化压缩方法中的三值量化方法对训练完成的神经网络量进行量化压缩,将32bit浮点型权值量化为2bit定点型权值,进一步减少其占用内存大小的同时还极大地减小了对于计算空间和时间的消耗;使用循环神经网络模型来构建前后帧的数据联系,以提高模型效果;且循环神经网络模型参数量较少,进一步减少其占用内存大小。