一种语音端点检测方法
基本信息
申请号 | CN201910288454.6 | 申请日 | - |
公开(公告)号 | CN110047470A | 公开(公告)日 | 2019-07-23 |
申请公布号 | CN110047470A | 申请公布日 | 2019-07-23 |
分类号 | G10L15/04;G10L15/18;G10L21/0232;G10L25/21;G10L25/45;G10L25/60 | 分类 | 乐器;声学; |
发明人 | 左靖东;况鹏;范振;詹佳丽;黎宁 | 申请(专利权)人 | 深圳市壹鸽科技有限公司 |
代理机构 | 深圳叁众知识产权代理事务所(普通合伙) | 代理人 | 深圳市壹鸽科技有限公司 |
地址 | 518000 广东省深圳市南山区粤海街道高新区社区高新南七道011号高新工业村T3栋3AA | ||
法律状态 | - |
摘要
摘要 | 本发明公开了一种语音端点检测方法,通过多窗谱减算法,将有噪声环境下的语音信号减噪,对语音进行增强,计算增强后语音的频域信号能量,并将该能量作为语音检测时的特征;分别计算每一帧的短时和长时能量均值作为每一帧对应的得分值和判决阈值,根据所述得分值和判决阈值的大小进行语音或非语音判决;最后,根据语义意图自适应调整说话间隙时长,判决出完整一句话的起止点位置。其具有较低的复杂度和计算量,并在复杂环境下具有很好的鲁棒性;不需要对各种环境噪声有先验知识,也能适应非平稳的各类噪声背景。 |
