语音驱动图像的方法、系统、装置及存储介质

基本信息

申请号 CN202110436595.5 申请日 -
公开(公告)号 CN113192162A 公开(公告)日 2021-07-30
申请公布号 CN113192162A 申请公布日 2021-07-30
分类号 G06T13/20(2011.01)I;G06K9/00(2006.01)I;G06N3/04(2006.01)I;G06N3/08(2006.01)I;G10L15/22(2006.01)I 分类 计算;推算;计数;
发明人 王伦基;李权;叶俊杰;朱杰;成秋喜;韩蓝青 申请(专利权)人 赛业(广州)生物科技有限公司
代理机构 广州嘉权专利商标事务所有限公司 代理人 常柯阳
地址 510530广东省广州市黄埔区香雪八路98号香雪国际公寓F栋
法律状态 -

摘要

摘要 本发明公开了一种语音驱动图像的方法、系统、装置及存储介质,所述方法包括:获取语音及图像;根据所述图像提取面部特征参数;将所述语音输入到头部位姿及表情预测模型获取系列动态参数;根据所述面部特征参数及所述系列动态参数生成系列图像;根据所述语音及所述系列图像生成视频文件。本发明实施例通过图像提取面部特征参数实现对多种图像的面部参数进行更准确的提取,通过头部位姿及表情预测模型获取与语音匹配的动态参数,通过语音、面部特征参数及动态参数生成生动逼真且与语音匹配的视频文件,整个过程操作简单且便于推广。本发明实施例可广泛应用于图像处理技术领域。