一种低内存消耗的高效离线命令词识别系统和建模方法
基本信息
申请号 | CN202111061384.4 | 申请日 | - |
公开(公告)号 | CN113963690A | 公开(公告)日 | 2022-01-21 |
申请公布号 | CN113963690A | 申请公布日 | 2022-01-21 |
分类号 | G10L15/16(2006.01)I;G10L15/22(2006.01)I;G10L15/20(2006.01)I;G10L15/02(2006.01)I;G10L15/06(2013.01)I;G10L25/24(2013.01)I;G10L25/30(2013.01)I;G10L25/87(2013.01)I;G06N3/08(2006.01)I;G06F17/16(2006.01)I | 分类 | 乐器;声学; |
发明人 | 唐浩元;马殿昌;王欢良;张李;王佳珺;黄正林 | 申请(专利权)人 | 苏州奇梦者科技有限公司 |
代理机构 | 苏州铭浩知识产权代理事务所(普通合伙) | 代理人 | 于浩江 |
地址 | 215000江苏省苏州市中国(江苏)自由贸易试验区苏州片区苏州工业园区若水路388号E1905室 | ||
法律状态 | - |
摘要
摘要 | 本发明提供了一种低内存消耗的高效离线命令词识别系统和建模方法,涉及语音识别技术领域;方法包括:提供一种模型参数压缩方法,对神经网络模型每一层的矩阵逐行进行压缩,将模型参数存储内存消耗降低70%~75%,同时将模型前向运算的矩阵浮点乘法运算转换成16位整型乘法运算,降低系统的计算复杂度;在解码网络中除命令词路径之外添加filler路径,用于解决命令词识别中的强噪声下的误识别问题;采用改进的解码器,在音频解码过程中实时对解码网格中的节点进行合并,极大的减少了解码网格中的节点数目,在不影响解码性能的基础上将解码的内存消耗降低75%~90%。 |
