一种语音识别技术的结构模型
基本信息
申请号 | CN201811509918.3 | 申请日 | - |
公开(公告)号 | CN111312227A | 公开(公告)日 | 2020-06-19 |
申请公布号 | CN111312227A | 申请公布日 | 2020-06-19 |
分类号 | G10L15/14(2006.01)I | 分类 | - |
发明人 | 邹灿;张峰 | 申请(专利权)人 | 上海元趣信息技术有限公司 |
代理机构 | 北京七夏专利代理事务所(普通合伙) | 代理人 | 上海元趣信息技术有限公司 |
地址 | 200000上海市浦东新区自由贸易实验区金科路2889弄6号(长泰广场E座)9层02单元 | ||
法律状态 | - |
摘要
摘要 | 本发明创造属于语音识别领域,具体涉及了一种语音识别技术的结构模型。为了解决存在的过程复杂、运算量大、结果粗糙而且有矛盾的问题,本发明创造提出了一种运算量小、训练过程简单、逻辑通顺而且边界清晰的语音识别技术的结构模型。本发明创造所采用的技术方案是,一种语音识别技术的结构模型,包括以下步骤:A1:提取语音信号的能量在不同频率范围的分布的特征,并进行建模;A2:结合记忆语音时序序列中上下文相关的信息对输入的特征信息进行抽象输出;A3:将A2抽象出来的特征映射到独立空间;A4:通过前向后向算法自动调整语音标注的边界针对整句进行训练从而对时序进行建模,并将A3中映射出来的语音的时序信息学习到神经网络参数中。 |
