基于生成对抗网络的高解析度音频编解码方法及系统

基本信息

申请号 CN202210463201.X 申请日 -
公开(公告)号 CN114582361B 公开(公告)日 2022-07-08
申请公布号 CN114582361B 申请公布日 2022-07-08
分类号 G10L19/26(2013.01)I;G10L19/24(2013.01)I;G10L19/032(2013.01)I;CN 111768793 A,2020.10.13;CN 103971693 A,2014.08.06;CN 101140759 A,2008.03.12;CN 112309408 A,2021.02.02;CN 107945811 A,2018.04.20;CN 112767954 A,2021.05.07;CN 111429926 A,2020.07.17;AU 2014283196 A1,2016.02.11;US 2021065723 A1,2021.03.04;US 2021166705 A1,2021.06.03 姜林.基于非线性映射模型的音频带宽扩展编码研究.《中国博士学位论文全文数据库 信息科技辑》.中国学术期刊(光盘版)电子杂志社,2020,(第1期),全文.;郭庆巍.高保真低速率音频编码关键技术研究.《中国优秀硕士学位论文全文数据库 信息科技辑》.2009,(第1期),全文.;Yang Xiang,et al..A Parallel-Data-Free Speech Enhancement Method Using Multi-Objective Learning Cycle-Consistent Generative Adversarial Network.《 IEEE/ACM Transactions on Audio, Speech, and Language Processing》.IEEE,2020,第28卷全文. 分类 乐器;声学;
发明人 李强;朱勇;王尧;叶东翔 申请(专利权)人 北京百瑞互联技术股份有限公司
代理机构 北京国科程知识产权代理事务所(普通合伙) 代理人 -
地址 100085北京市海淀区上地三街9号A座9层A1009
法律状态 -

摘要

摘要 本申请公开了一种基于生成对抗网络的高解析度音频编解码方法及系统,属于音频编解码技术领域,该方法包括:通过正交镜像分析滤波器对编码音频进行滤波,得到低频带音频数据和高频带音频数据;对低频带音频数据进行标准LC3编码,得到低频带码流,获取低频谱包络;根据低频谱包络和高频带音频数据对应的频域谱系数,得到高频带码流;音频接收端对低频带码流进行标准LC3解码流程,获取低频谱系数,并得到解码后的低频带数据;利用预训练的生成网络,对高频带码流进行处理,得到解码后的高频带数据;通过正交镜像合成滤波器对低频带数据和高频带数据进行合成,得到解码结果。本申请实现以两倍的标准采样率实现高解析度音频编解码。