一种基于模型融合框架的两阶段语音唤醒算法
基本信息
申请号 | 2020110419835 | 申请日 | - |
公开(公告)号 | CN112259085A | 公开(公告)日 | 2021-01-22 |
申请公布号 | CN112259085A | 申请公布日 | 2021-01-22 |
分类号 | G10L15/16(2006.01)I; | 分类 | 乐器;声学; |
发明人 | 朱国锋;蔡洪滨;何昕 | 申请(专利权)人 | 上海声瀚信息科技有限公司 |
代理机构 | 北京化育知识产权代理有限公司 | 代理人 | 尹均利 |
地址 | 200120上海市浦东新区中国(上海)自由贸易试验区纳贤路800号1幢A座608室 | ||
法律状态 | - |
摘要
摘要 | 本发明公开了一种基于模型融合框架的两阶段语音唤醒算法,1)准备两个不同结构的神经网络,第一阶段训练一个小模型,应用训练数据;2)训练结束后,所有负样本训练数据过模型得到不同的分数,将一定得分以上的音频段选出来,作为region of interest,加上原本的正样本,作为第二阶段训练的数据;3)解码时,需要输入音频通过两个模型结果都大于阈值才可以唤醒;本发明提供的一种基于模型融合框架的两阶段语音唤醒算法,通过结果层面模型融合的方式从工程上构建两个阶段的唤醒判别,使得网络层面实现简单。 |
