一种超短语音语种识别方法

基本信息

申请号 CN202110752462.9 申请日 -
公开(公告)号 CN113327604A 公开(公告)日 2021-08-31
申请公布号 CN113327604A 申请公布日 2021-08-31
分类号 G10L15/16(2006.01)I;G10L15/20(2006.01)I;G10L15/04(2013.01)I;G10L15/00(2013.01)I;G10L15/32(2013.01)I 分类 乐器;声学;
发明人 缪蔚;刘俊南;魏欣;王化;齐心 申请(专利权)人 因诺微科技(天津)有限公司
代理机构 天津诺德知识产权代理事务所(特殊普通合伙) 代理人 朱卉
地址 300000天津市滨海新区华苑产业区(环外)海泰发展五道16号B-6号楼-1-502
法律状态 -

摘要

摘要 一种超短语音语种识别方法,所述方法包括步骤:输入语音信号;对所述输入语音信号进行预处理;对所述输入语音信号进行特征提取;使用多路差异感受野卷积神经网络模型对所述输入语音信号进行识别。本发明提出一种超短语音语种识别方法,提供更高的响应速度以及在短语音上的识别精度,本发明使用多路时延神经网络作为主要结构,每路卷积神经网络使用不同的卷积核心,提供不同的感受野抽取特征,在深度特征上进行融合,本发明提升了模型识别精度,减小了模型参数,可应用与1s的超短语音,可快速响应。