语音驱动图像的方法、系统、装置及存储介质专利查询专利号|摘要-满商公司网

语音驱动图像的方法、系统、装置及存储介质

基本信息

摘要

摘要	本发明公开了一种语音驱动图像的方法、系统、装置及存储介质，所述方法包括：获取语音及图像；根据所述图像提取面部特征参数；将所述语音输入到头部位姿及表情预测模型获取系列动态参数；根据所述面部特征参数及所述系列动态参数生成系列图像；根据所述语音及所述系列图像生成视频文件。本发明实施例通过图像提取面部特征参数实现对多种图像的面部参数进行更准确的提取，通过头部位姿及表情预测模型获取与语音匹配的动态参数，通过语音、面部特征参数及动态参数生成生动逼真且与语音匹配的视频文件，整个过程操作简单且便于推广。本发明实施例可广泛应用于图像处理技术领域。