基于有监督机器学习的语音端点检测方法及装置
基本信息
申请号 | CN201710957669.3 | 申请日 | - |
公开(公告)号 | CN107799126B | 公开(公告)日 | 2018-03-13 |
申请公布号 | CN107799126B | 申请公布日 | 2018-03-13 |
分类号 | G10L25/87(2013.01)I;G10L15/04(2013.01)I | 分类 | 乐器;声学; |
发明人 | 宋亚楠;邱楠;王昊奋 | 申请(专利权)人 | 上海瓦歌智能科技有限公司 |
代理机构 | 北京酷爱智慧知识产权代理有限公司 | 代理人 | 安娜 |
地址 | 215000 江苏省苏州市姑苏区人民路239号39幢301室 | ||
法律状态 | - |
摘要
摘要 | 本发明涉及一种基于有监督机器学习的语音端点检测方法及装置,所述方法包括:从获取的音频中检测出静音段、过度段和结束段;将静音段和结束段输入预先构建的背景噪声模型,识别所述音频所属的当前场景;将待识别语音段用向量表示,其中,待识别语音段为除去所述静音段、所述过度段和所述结束段的音频;将识别的所述当前场景和向量化后的待识别语音段输入预先构建的RNN模型,识别语音端点,其中,语音端点包括语音段的起始点、语音段的终点。本发明提供的一种基于有监督机器学习的语音端点检测方法及装置,通过判断当前所处的场景,将场景作为RNN模型的输入参数之一,提升RNN模型的判断的准确性,提高了语音端点检测的准确性和效率。 |
