AI主播视频的生成方法、装置、电子设备及存储介质
基本信息
申请号 | CN202110519344.3 | 申请日 | - |
公开(公告)号 | CN113256765A | 公开(公告)日 | 2021-08-13 |
申请公布号 | CN113256765A | 申请公布日 | 2021-08-13 |
分类号 | G06T11/60(2006.01)I;G06T5/00(2006.01)I;G10L13/04(2013.01)I | 分类 | 计算;推算;计数; |
发明人 | 陈达勤;宋博宁;浣军;李曈;娄明;王淳 | 申请(专利权)人 | 北京深尚科技有限公司 |
代理机构 | 成都顶峰专利事务所(普通合伙) | 代理人 | 王霞 |
地址 | 100000北京市海淀区海淀北二街8号5层601 | ||
法律状态 | - |
摘要
摘要 | 本申请提供了一种AI主播视频的生成方法、装置、电子设备及存储介质,涉及人工智能技术领域。方法包括将音频数据和AI主播图像作为第一模型的输入运算,得到第一唇形图像序列;将第一唇形图像序列作为第二模型的输入运算,得到第二唇形图像序列;将第二唇形图像序列与AI主播图像进行图像融合,得到AI主播视频;第一模型是以历史音频数据和AI主播图像作为输入,唇形图像作为输出训练得到的,第二模型是以第一清晰度的历史唇形图像序列作为输入,第二清晰度的历史唇形图像序列作为输出训练得到的,第二清晰度高于第一清晰度。本申请提供的方法、装置、电子设备及存储介质可以较低成本得到高清晰度的唇形图像,降低AI主播视频的制作成本。 |
