一种语音关键词检索方法、装置、设备及存储介质

基本信息

申请号 CN201810928045.3 申请日 -
公开(公告)号 CN108922521A 公开(公告)日 2021-07-06
申请公布号 CN108922521A 申请公布日 2021-07-06
分类号 G10L15/08;G10L15/14;G10L15/16 分类 乐器;声学;
发明人 方磊;殷兵;刘俊华;方四安;徐承 申请(专利权)人 合肥讯飞数码科技有限公司
代理机构 北京集佳知识产权代理有限公司 代理人 王云晓;王宝筠
地址 230088 安徽省合肥市高新区望江西路666号讯飞大厦1805、1807室
法律状态 -

摘要

摘要 本申请提供了一种语音关键词检索方法、装置、设备及存储介质,方法包括:从目标语种的目标语音数据中提取目标语音特征;通过预先构建的稀疏编码器将目标语音特征转换为后验特征,获得目标语音数据的后验特征,稀疏编码器以从目标语种的无标注训练语音数据中提取的语音特征为训练样本进行训练得到;基于目标语音数据的后验特征和预先基于目标关键词语音数据的后验特征构建的解码网络,确定目标语音数据中是否含有目标关键词,目标关键词语音数据的后验特征通过稀疏编码器确定。本申请通过稀疏编码器能够确定出鲁棒性较高的后验特征,采用基于稀疏编码器确定的后验特征进行关键词识别,能够提升关键词的检出率和检出准确率,检索效果较好。