基于分数阶傅里叶变换的语音非语音检测方法
基本信息
申请号 | CN201310557124.5 | 申请日 | - |
公开(公告)号 | CN103578466A | 公开(公告)日 | 2014-02-12 |
申请公布号 | CN103578466A | 申请公布日 | 2014-02-12 |
分类号 | G10L15/04(2013.01)I | 分类 | 乐器;声学; |
发明人 | 张卫强;刘加 | 申请(专利权)人 | 北京华控创为信息技术有限公司 |
代理机构 | 北京众合诚成知识产权代理有限公司 | 代理人 | 清华大学;北京华控创为信息技术有限公司 |
地址 | 100084 北京市海淀区北京市100084-82信箱 | ||
法律状态 | - |
摘要
摘要 | 本发明公开了语音信号处理领域的一种基于分数阶傅里叶变换的语音非语音检测方法。其技术方案是,首先对音频信号分帧,然后进行零均值化和加窗处理,接着对每帧信号进行不同阶次的分数阶傅里叶变换,得到其分数阶频谱,然后计算分数阶频谱熵,选择各个阶次中最大的分数阶频谱熵,与阈值进行比较即可得到判决结果。该方法处理方法统一,流程简单,可以有效提高提高语音非语音检测的性能;可以实现音频信号中静音、噪音、音乐等“垃圾”信号的有效过滤。 |
