一种基音混合方法及装置

基本信息

申请号 CN201911414847.3 申请日 -
公开(公告)号 CN111210811A 公开(公告)日 2020-05-29
申请公布号 CN111210811A 申请公布日 2020-05-29
分类号 G10L15/08;G10L15/20;G10L15/22;G10L25/30;G10L25/84 分类 乐器;声学;
发明人 张尉雄 申请(专利权)人 深圳市瑞讯云技术有限公司
代理机构 北京润泽恒知识产权代理有限公司 代理人 深圳市瑞讯云技术有限公司
地址 518000 广东省深圳市前海深港合作区前湾一路1号A栋201室(入驻深圳市前海商务秘书有限公司)
法律状态 -

摘要

摘要 本发明实施例提供了一种基音混合方法及装置,应用于人工智能系统,所述方法包括:当所述人工智能系统接收唤醒指令时,获取当前的环境音频数据;接收用户输入的用户音频数据;将所述环境音频数据拆分成拆分音频数据;合并所述用户音频数据与所述多路拆分音频数据,生成混合音频数据。本实施例提出的方法操作简便,可以从语音数据中提取出各个语言特征以及不同的语音数据,并利用不同的语音数据或语音特征和预设的语音数据进行混合,可以实现人工智能系统的基音混合,同时在混合过程中的计算量小,也降低了系统功耗,而且可以采用混合音频数据进行语音训练,也提高了人工智能系统识别的准确度,可以准确识别用户的指令。