基于共振峰的口型表情动画生成方法、装置及存储介质

基本信息

申请号 CN202011618339.X 申请日 -
公开(公告)号 CN112700520A 公开(公告)日 2021-04-23
申请公布号 CN112700520A 申请公布日 2021-04-23
分类号 G06T13/20;G06T13/40;G10L19/032 分类 计算;推算;计数;
发明人 吴强;季晓枫;施恩铭;马俊;郭翔 申请(专利权)人 上海幻维数码创意科技股份有限公司
代理机构 上海科盛知识产权代理有限公司 代理人 赵继明
地址 200072 上海市静安区广中西路777弄13号
法律状态 -

摘要

摘要 本发明涉及一种基于共振峰的口型表情动画生成方法、装置及存储介质,方法包括以下步骤:对音频信号进行分帧处理;进行快速傅里叶变换,得到每个语音帧的频谱,获取每个语音帧的共振峰数据;基于共振峰数据得到每个语音帧对应的控制字;替换控制序列中的奇异点,得到元音序列,基于元音序列,生成口型动画和表情动画。与现有技术相比,本发明基于共振峰数据,得到每个声音帧对应的元音,再通过替换奇异点,可以减少抖动,口型和表情的变化更加自然流畅,保证了视觉效果,提升了用户体验;每次自元音序列中读取多个控制字,将出现次数最多的控制字作为目标控制字,进一步抑制了因声音突变而造成的口型和表情突变。