一种基于文本的自动化视频生成方法
基本信息
申请号 | CN202010504729.8 | 申请日 | - |
公开(公告)号 | CN112002301A | 公开(公告)日 | 2020-11-27 |
申请公布号 | CN112002301A | 申请公布日 | 2020-11-27 |
分类号 | G10L13/02(2013.01)I | 分类 | 乐器;声学; |
发明人 | 武钧;彭寒兵 | 申请(专利权)人 | 四川纵横六合科技股份有限公司 |
代理机构 | 成都聚蓉众享知识产权代理有限公司 | 代理人 | 四川纵横六合科技股份有限公司 |
地址 | 610000四川省成都市人民南路四段9号 | ||
法律状态 | - |
摘要
摘要 | 本发明公开了一种基于文本的自动化视频生成方法,属于文本处理技术领域,目的在于提供一种基于文本的自动化视频生成方法,能够智能化生成符合文本内容的视频片段,基于文本有效生成对应用户的音视频。其包括以下步骤:(1)将文本转化成语音;(2)将生成的语音音素对齐;(3)将每个音素分为形成口型、保持口型、解除口型三个阶段,将连续的嘴唇动作离散化,再确定每个离散的嘴唇动作的时间参数,并根据每个音素确定口型的静态视位;(4)根据人物、环境的相关参数,进行三维人脸建模,将口型的静态视位对应的图像插入视频的每一帧,合成连续的视频;(5)对建模的人脸进行人脸渲染。本发明适用于基于文本的自动化视频生成方法。 |
