一种语音增强方法、电子设备、芯片系统及可读存储介质

基本信息

申请号 CN202210080908.2 申请日 -
公开(公告)号 CN114093380B 公开(公告)日 2022-07-05
申请公布号 CN114093380B 申请公布日 2022-07-05
分类号 G10L21/02(2013.01)I;G10L21/0232(2013.01)I;G10L25/30(2013.01)I;G10L25/87(2013.01)I;G06K9/62(2022.01)I;G06N3/04(2006.01)I 分类 乐器;声学;
发明人 玄建永;刘镇亿;高海宽;郭鑫涛 申请(专利权)人 北京荣耀终端有限公司
代理机构 深圳中一联合知识产权代理有限公司 代理人 -
地址 100095 北京市海淀区忍冬路5号院3号楼2-14层
法律状态 -

摘要

摘要 本申请提供一种语音增强方法、电子设备、芯片系统及可读存储介质,涉及音视频处理技术领域;该方法包括:提取视频流中的图像帧的图像特征;提取音频流中的音频帧的频域特征,其中,所述音频流和所述视频流具有时间相关性;将所述图像特征和所述频域特征进行拼接,得到拼接特征;识别所述拼接特征在各频点上存在语音的概率值;基于所述概率值和所述音频帧,得到语音增强后的音频流;通过该方法可以改善语音增强效果。