一种基于深度学习特征连接分析的语音事件提取方法

基本信息

申请号 CN202111071902.0 申请日 -
公开(公告)号 CN113963228A 公开(公告)日 2022-01-21
申请公布号 CN113963228A 申请公布日 2022-01-21
分类号 G06V10/774(2022.01)I;G06V10/82(2022.01)I;G06K9/62(2022.01)I;G06N3/04(2006.01)I;G06N3/08(2006.01)I 分类 计算;推算;计数;
发明人 王珂;王圣川;景亮;蒋波;郭耀川 申请(专利权)人 电信科学技术第五研究所有限公司
代理机构 成都九鼎天元知识产权代理有限公司 代理人 徐静
地址 610021四川省成都市锦江区大慈寺路22号
法律状态 -

摘要

摘要 本发明提供一种基于深度学习特征连接分析的语音事件提取方法,包括:对用于训练的语音信号文件进行预处理得到训练语图样本文件以及样本标签,并制作成训练数据集;采用训练数据集训练深度学习卷积神经网络模型;对待预测语音信号文件进行预处理得到包含若干待预测语图样本文件的待预测数据集;将待预测数据集输入训练好的深度学习卷积神经网络模型进行预测,并将预测结果拼接为一组特征向量;对特征向量进行特征处理,特征向量中的特征值大于设定阈值即语音事件的位置信息,根据语音事件的位置信息从待预测语音信号文件中提取语音事件。本发明能够在语音信号较弱的情况下依然能够进行识别并提取,并且用特征向量的方式来表达语音信号,其精度高。