一种实时语音端点检测方法及装置
基本信息
申请号 | CN201811491292.8 | 申请日 | - |
公开(公告)号 | CN109545188B | 公开(公告)日 | 2021-07-09 |
申请公布号 | CN109545188B | 申请公布日 | 2021-07-09 |
分类号 | G10L15/04;G10L25/03;G10L25/21;G10L25/51;G10L25/78 | 分类 | 乐器;声学; |
发明人 | 张虎 | 申请(专利权)人 | 深圳市友杰智新科技有限公司 |
代理机构 | 深圳市深可信专利代理有限公司 | 代理人 | 刘昌刚 |
地址 | 518000 广东省深圳市南山区招商街道蛇口南海大道1079号花园城数码大厦A座402 | ||
法律状态 | - |
摘要
摘要 | 本发明涉及语音技术领域,具体地说,涉及一种实时语音端点检测方法及装置,方法包括以下步骤:信号分帧、加重;去脉冲处理;去除直流成分;计算每帧信号的短时能量和过零率;加窗处理;减谱处理;计算谱熵;计算变换平滑谱熵;语音帧和噪声帧初步判断;变换平滑谱熵与阈值的处理;语音段起始帧、结束帧判断;本发明根据信号是根据何种条件判断出来以及判断的结果,加权更新减谱阈值、变换平滑谱熵、相应的短时能量、相应的短时平均能量、减谱功率谱等参数的阈值,以使各阈值越来越准确,最终判断出的语音起始帧、结束帧也越来越准确;本发明能高效、准确地实时检测语音。 |
