基于滑动窗口的端点检测方法、装置和语音识别系统
基本信息
申请号 | CN200410083807.2 | 申请日 | - |
公开(公告)号 | CN1763844A | 公开(公告)日 | 2006-04-26 |
申请公布号 | CN1763844A | 申请公布日 | 2006-04-26 |
分类号 | G10L15/04(2006.01);G10L15/20(2006.01);G10L15/28(2006.01);G10L19/02(2006.01);G10L15/00(2006.01) | 分类 | 乐器;声学; |
发明人 | 余洪涌;赵庆卫 | 申请(专利权)人 | 北京中科信利通信技术有限公司 |
代理机构 | 北京北翔知识产权代理有限公司 | 代理人 | 中国科学院声学研究所;北京中科信利通信技术有限公司;北京中科信利技术有限公司 |
地址 | 100080北京市海淀区北四环西路21号DSP大楼 | ||
法律状态 | - |
摘要
摘要 | 本发明提供一种端点检测方法和装置,用于检测具有背景噪音的输入语音信号的语音端点,所述方法包括下列步骤:对输入语音信号施加一个窗口,取一定的帧数目作为窗口大小;确定输入语音信号中的背景噪音开始点并且计算背景噪音能量;计算当前帧的声音能量并且进而计算窗口能量;比较窗口的总声音能量是否大于背景噪音能量和语音开始点信噪比的乘积;如果不是,则窗口向下一帧滑动,并且返回计算当前帧声音能量步骤;如果是,则判断当前帧为语音开始点。本发明的端点检测方法提高端点检测的准确性,改善鲁棒性和提高语音识别系统的总体识别率。本发明的端点检测方法和装置通常应用在语音识别系统中。 |
