基于有监督机器学习的语音端点检测方法及装置专利查询专利号|摘要-满商公司网

基于有监督机器学习的语音端点检测方法及装置

基本信息

摘要

摘要	本发明涉及一种基于有监督机器学习的语音端点检测方法及装置，所述方法包括：从获取的音频中检测出静音段、过度段和结束段；将静音段和结束段输入预先构建的背景噪声模型，识别所述音频所属的当前场景；将待识别语音段用向量表示，其中，待识别语音段为除去所述静音段、所述过度段和所述结束段的音频；将识别的所述当前场景和向量化后的待识别语音段输入预先构建的RNN模型，识别语音端点，其中，语音端点包括语音段的起始点、语音段的终点。本发明提供的一种基于有监督机器学习的语音端点检测方法及装置，通过判断当前所处的场景，将场景作为RNN模型的输入参数之一，提升RNN模型的判断的准确性，提高了语音端点检测的准确性和效率。