基于有监督机器学习的语音端点检测方法及装置

基本信息

申请号 CN201710957669.3 申请日 -
公开(公告)号 CN107799126B 公开(公告)日 2018-03-13
申请公布号 CN107799126B 申请公布日 2018-03-13
分类号 G10L25/87(2013.01)I;G10L15/04(2013.01)I 分类 乐器;声学;
发明人 宋亚楠;邱楠;王昊奋 申请(专利权)人 上海瓦歌智能科技有限公司
代理机构 北京酷爱智慧知识产权代理有限公司 代理人 安娜
地址 215000 江苏省苏州市姑苏区人民路239号39幢301室
法律状态 -

摘要

摘要 本发明涉及一种基于有监督机器学习的语音端点检测方法及装置,所述方法包括:从获取的音频中检测出静音段、过度段和结束段;将静音段和结束段输入预先构建的背景噪声模型,识别所述音频所属的当前场景;将待识别语音段用向量表示,其中,待识别语音段为除去所述静音段、所述过度段和所述结束段的音频;将识别的所述当前场景和向量化后的待识别语音段输入预先构建的RNN模型,识别语音端点,其中,语音端点包括语音段的起始点、语音段的终点。本发明提供的一种基于有监督机器学习的语音端点检测方法及装置,通过判断当前所处的场景,将场景作为RNN模型的输入参数之一,提升RNN模型的判断的准确性,提高了语音端点检测的准确性和效率。