一种基于深度学习分类组合的语音事件提取方法

基本信息

申请号 CN202111071917.7 申请日 -
公开(公告)号 CN113961676A 公开(公告)日 2022-01-21
申请公布号 CN113961676A 申请公布日 2022-01-21
分类号 G06F16/332(2019.01)I;G06F16/33(2019.01)I;G06F16/338(2019.01)I;G06K9/62(2022.01)I;G06N3/04(2006.01)I;G06N3/08(2006.01)I;G06V10/774(2022.01)I;G06V10/82(2022.01)I 分类 计算;推算;计数;
发明人 王珂;王圣川;景亮;李芝权;李远绳 申请(专利权)人 电信科学技术第五研究所有限公司
代理机构 成都九鼎天元知识产权代理有限公司 代理人 徐静
地址 610021四川省成都市锦江区大慈寺路22号
法律状态 -

摘要

摘要 本发明提供一种基于深度学习分类组合的语音事件提取方法,包括:对用于训练的语音信号文件进行预处理得到训练语图样本文件以及样本标签,并制作成训练数据集;采用训练数据集训练深度学习卷积神经网络模型;对待预测语音信号文件进行预处理得到若干待预测语图样本文件;将若干待预测语图样本文件输入训练好的深度学习卷积神经网络模型进行预测分类,得到若干分类结果,并将分类结果拼接为特征向量;对特征向量进行连续性处理,得到语音事件的位置信息,然后根据语音事件的位置信息从原始的待预测语音信号文件中提取语音事件。本发明使用深度学习二分类处理以及连续性算法,能够在语音信号弱或受干扰时也能有不错的提取效果。