流式语音识别的处理方法、装置和计算机设备
基本信息
申请号 | CN202111054122.5 | 申请日 | - |
公开(公告)号 | CN113506575A | 公开(公告)日 | 2021-10-15 |
申请公布号 | CN113506575A | 申请公布日 | 2021-10-15 |
分类号 | G10L15/22(2006.01)I;G10L15/06(2013.01)I;G10L19/022(2013.01)I | 分类 | 乐器;声学; |
发明人 | 李杰;王广新;杨汉丹 | 申请(专利权)人 | 深圳市友杰智新科技有限公司 |
代理机构 | 深圳市明日今典知识产权代理事务所(普通合伙) | 代理人 | 王杰辉 |
地址 | 518000广东省深圳市南山区招商街道沿山社区沿山路22号火炬大厦501 | ||
法律状态 | - |
摘要
摘要 | 本申请提供了一种流式语音识别的处理方法、装置和计算机设备,识别系统采集初始语音数据,对初始语音数据进行一次滑窗处理,得到若干个二次语音数据。再按照各个二次语音数据的采集时间顺序,依次将各个二次语音数据输入预先训练的语音识别模型进行处理,得到各个初始序列矩阵。每次语音识别模型输出新的初始序列矩阵时,识别系统将当前时刻的初始序列矩阵与预设数量个相邻上一时刻的初始序列矩阵进行拼接,得到二次序列矩阵。在每次得到新的二次序列矩阵时,对二次序列矩阵进行二次滑窗处理,得到最终序列矩阵。识别系统调用识别算法在所述最终序列矩阵上进行搜索,获得识别结果,处理速度快,准确度高。 |
