一种基于模型融合框架的两阶段语音唤醒算法

基本信息

申请号 2020110419835 申请日 -
公开(公告)号 CN112259085A 公开(公告)日 2021-01-22
申请公布号 CN112259085A 申请公布日 2021-01-22
分类号 G10L15/16(2006.01)I; 分类 乐器;声学;
发明人 朱国锋;蔡洪滨;何昕 申请(专利权)人 上海声瀚信息科技有限公司
代理机构 北京化育知识产权代理有限公司 代理人 尹均利
地址 200120上海市浦东新区中国(上海)自由贸易试验区纳贤路800号1幢A座608室
法律状态 -

摘要

摘要 本发明公开了一种基于模型融合框架的两阶段语音唤醒算法,1)准备两个不同结构的神经网络,第一阶段训练一个小模型,应用训练数据;2)训练结束后,所有负样本训练数据过模型得到不同的分数,将一定得分以上的音频段选出来,作为region of interest,加上原本的正样本,作为第二阶段训练的数据;3)解码时,需要输入音频通过两个模型结果都大于阈值才可以唤醒;本发明提供的一种基于模型融合框架的两阶段语音唤醒算法,通过结果层面模型融合的方式从工程上构建两个阶段的唤醒判别,使得网络层面实现简单。