一种基于深度学习双模型的语音连续事件提取方法专利查询专利号|摘要-满商公司网

一种基于深度学习双模型的语音连续事件提取方法

基本信息

摘要

摘要	本发明提供一种基于深度学习双模型的语音连续事件提取方法，包括：对用于训练的语音信号文件进行相应的预处理分别得到VOC格式数据集和三元组数据集；采用VOC格式数据集训练YOLOV3深度学习模型；采用三元组数据集训练构建的深度学习人声分类网络模型；利用训练好的YOLOV3深度学习模型和深度学习人声分类网络模型对待预测语音信号文件进行预测得到特征向量；利用特征向量判断对应的语音事件是否是相同人声，并合并相同人声的语音事件后从原始的待预测语音信号文件中提取语音事件。本发明通过深度学习双模型的方式提取语音事件，抗噪声能力强，灵敏度高，即使在语音信号较弱的情况下效果依然显著。