一种应用于电力调度领域的语音识别方法及装置

基本信息

申请号 CN201911002395.8 申请日 -
公开(公告)号 CN110689880A 公开(公告)日 2020-01-14
申请公布号 CN110689880A 申请公布日 2020-01-14
分类号 G10L15/16;G10L15/26;G10L15/02;G10L15/06;G10L15/20;G10L15/07;G10L25/24 分类 乐器;声学;
发明人 鄢发齐;汪旸;王春明;程迪;陈钟钟;刘志成;徐浩;董向明;孙涛;吴怡菲;曲亮;金勇 申请(专利权)人 武汉烽火普天信息技术有限公司
代理机构 武汉维创品智专利代理事务所(特殊普通合伙) 代理人 武汉烽火普天信息技术有限公司;国家电网公司华中分部
地址 430077 湖北省武汉市武昌区徐东大街231号
法律状态 -

摘要

摘要 本发明实施例提供一种应用于电力调度领域的语音识别方法及装置。包括:将待识别语音的功率归一化倒谱系数特征输入至预设神经网络模型中的卷积神经网络,得到新的特征;将新的特征、功率归一化倒谱系数特征和说话人特征进行拼接,得到混合特征;将混合特征输入至预设神经网络模型中的若干组交替设置的时间延迟神经网络和双向长短期记忆循环神经网络,得到词序列集合针对待识别语音特征的后验概率;根据后验概率结合语言模型对待识别语音进行解码,得到识别出的词序列。在电力调度领域提出基于上述三个网络的语音识别声学模型多网络混合训练方法,使得能够通过训练好的模型对待识别语音进行识别,降低调度员的工作强度并缩短其重复性工作的时间。