一种基于未标注关键词数据的关键词检测方法及系统

基本信息

申请号 CN202110810561.8 申请日 -
公开(公告)号 CN113282785A 公开(公告)日 2021-08-20
申请公布号 CN113282785A 申请公布日 2021-08-20
分类号 G06F16/65(2019.01)I;G06F16/683(2019.01)I;G06F16/68(2019.01)I;G06K9/62(2006.01)I;G06N3/04(2006.01)I;G06N3/08(2006.01)I 分类 计算;推算;计数;
发明人 阮晓辉;魏庆凯 申请(专利权)人 北京快鱼电子股份公司
代理机构 北京天盾知识产权代理有限公司 代理人 张彩珍
地址 100093北京市海淀区闵庄路3号清华科技园玉泉慧谷3栋
法律状态 -

摘要

摘要 本发明公开了一种基于未标注关键词数据的关键词检测方法及系统,包括采集大量的未标注音频数据,在未标注音频数据中添加预设的唤醒词音频和非唤醒词音频,构成预处理音频库;基于无监督深度学习分类方法对预处理音频库中的音频数据进行分类;对分类后的音频数据提取特征以生成特征数据;将特征数据分别输入至不同类型的神经网络模型中进行训练以得到多个不同的关键词检测模型;基于多个不同的关键词检测模型对待预测音频进行检测以得到最终检测结果;该方法对音频数据进行综合对比分类训练,分类准确率更高。