一种基于文本的自动化视频生成方法

基本信息

申请号 CN202010504729.8 申请日 -
公开(公告)号 CN112002301A 公开(公告)日 2020-11-27
申请公布号 CN112002301A 申请公布日 2020-11-27
分类号 G10L13/02(2013.01)I 分类 乐器;声学;
发明人 武钧;彭寒兵 申请(专利权)人 四川纵横六合科技股份有限公司
代理机构 成都聚蓉众享知识产权代理有限公司 代理人 四川纵横六合科技股份有限公司
地址 610000四川省成都市人民南路四段9号
法律状态 -

摘要

摘要 本发明公开了一种基于文本的自动化视频生成方法,属于文本处理技术领域,目的在于提供一种基于文本的自动化视频生成方法,能够智能化生成符合文本内容的视频片段,基于文本有效生成对应用户的音视频。其包括以下步骤:(1)将文本转化成语音;(2)将生成的语音音素对齐;(3)将每个音素分为形成口型、保持口型、解除口型三个阶段,将连续的嘴唇动作离散化,再确定每个离散的嘴唇动作的时间参数,并根据每个音素确定口型的静态视位;(4)根据人物、环境的相关参数,进行三维人脸建模,将口型的静态视位对应的图像插入视频的每一帧,合成连续的视频;(5)对建模的人脸进行人脸渲染。本发明适用于基于文本的自动化视频生成方法。