基于多传感器的人体发声状态检测方法、系统及存储介质
基本信息
申请号 | CN202011567270.2 | 申请日 | - |
公开(公告)号 | CN112750464A | 公开(公告)日 | 2021-05-04 |
申请公布号 | CN112750464A | 申请公布日 | 2021-05-04 |
分类号 | G10L25/51;H04R1/08;G01D21/02 | 分类 | 乐器;声学; |
发明人 | 李海进;宋少鹏;赵清明;孙浩海;张清 | 申请(专利权)人 | 深圳米唐科技有限公司 |
代理机构 | 深圳信科专利代理事务所(普通合伙) | 代理人 | 吴军 |
地址 | 518000 广东省深圳市宝安区新安街道兴东社区72区留仙三路36号3002室 | ||
法律状态 | - |
摘要
摘要 | 本发明公开了基于多传感器的人体发声状态检测方法、系统及存储介质,压力传感和光学传感根据预设阈值上报中断给主控芯片,主控芯片判断设备工作状态,计算骨振动传感采集的声带振动转换成的音频和麦克风采集的音频数据间互相关系数;若该系数高于人体发声相关度阈值,且压力传感检测该段时间的平均压力变化模型、光学传感检测该段时间人体局部起伏波动数据模型与预置数据模型近似,则将两音频数据通过HSD人体发声检测算法判断当前是否检测到人体发声状态,依据模型做人机交互意图判断和通话降噪应用。该方案解决大背景噪音环境下准确检测人体发声状态的问题,精确检测人体发声状态的起始结束时间点,提升大噪声环境人机交互体验和通话质量。 |
