一种实时语音端点检测方法及装置

基本信息

申请号 CN201811491292.8 申请日 -
公开(公告)号 CN109545188B 公开(公告)日 2021-07-09
申请公布号 CN109545188B 申请公布日 2021-07-09
分类号 G10L15/04;G10L25/03;G10L25/21;G10L25/51;G10L25/78 分类 乐器;声学;
发明人 张虎 申请(专利权)人 深圳市友杰智新科技有限公司
代理机构 深圳市深可信专利代理有限公司 代理人 刘昌刚
地址 518000 广东省深圳市南山区招商街道蛇口南海大道1079号花园城数码大厦A座402
法律状态 -

摘要

摘要 本发明涉及语音技术领域,具体地说,涉及一种实时语音端点检测方法及装置,方法包括以下步骤:信号分帧、加重;去脉冲处理;去除直流成分;计算每帧信号的短时能量和过零率;加窗处理;减谱处理;计算谱熵;计算变换平滑谱熵;语音帧和噪声帧初步判断;变换平滑谱熵与阈值的处理;语音段起始帧、结束帧判断;本发明根据信号是根据何种条件判断出来以及判断的结果,加权更新减谱阈值、变换平滑谱熵、相应的短时能量、相应的短时平均能量、减谱功率谱等参数的阈值,以使各阈值越来越准确,最终判断出的语音起始帧、结束帧也越来越准确;本发明能高效、准确地实时检测语音。