一种基于图卷积神经网络的语音关键词识别系统及方法

基本信息

申请号 CN202011057897.3 申请日 -
公开(公告)号 CN112435652A 公开(公告)日 2021-03-02
申请公布号 CN112435652A 申请公布日 2021-03-02
分类号 G10L15/02(2006.01)I;G10L15/22(2006.01)I;G06N3/04(2006.01)I;G06K9/62(2006.01)I;G06K9/40(2006.01)I;G10L15/08(2006.01)I;G06N3/08(2006.01)I 分类 乐器;声学;
发明人 陈曦;宋丹丹;欧阳鹏;尹首一 申请(专利权)人 江苏清微智能科技有限公司
代理机构 北京索睿邦知识产权代理有限公司 代理人 李根
地址 211100江苏省南京市江宁区麒麟科技创新园创研路266号人工智能产业园8号楼3层
法律状态 -

摘要

摘要 本发明公开一种基于图卷积神经网络的语音关键词识别系统及方法,属于神经网络的轻量级、低功耗的语音关键词识别方法技术领域。包括:一个语音数据采集模块、一个带通滤波器、一个声学特征提取模块、一个神经网络分类器和一个基础网络结构。基于图卷积神经网络的语音关键词识别系统使用窄通道的bottleneck结构和残差连接的方式,在精度相当的情况下显著压缩了网络的复杂度,实现了高效的网络计算,更适用于低资源设备场景的应用。引入图卷积网络对卷积特征图全局上下文进行建模,提高了语音关键词识别准确率。本发明解决了现有技术中基于卷积神经网络的关键词识别方法网络复杂度还比较高和计算仍然比较密集和卷积神经网络难以提取全局信息的问题。