一种基于文本内容数据清洗的语音合成播报系统
基本信息
申请号 | CN201910901689.8 | 申请日 | - |
公开(公告)号 | CN110767211A | 公开(公告)日 | 2020-02-07 |
申请公布号 | CN110767211A | 申请公布日 | 2020-02-07 |
分类号 | G10L13/08;G06F40/289 | 分类 | 乐器;声学; |
发明人 | 李蜜;丁超;胡晓伟 | 申请(专利权)人 | 浙江斑智科技有限公司 |
代理机构 | 广州辰联知识产权代理有限公司 | 代理人 | 浙江从泰网络科技有限公司 |
地址 | 310012 浙江省杭州市余杭区创鑫时代广场3幢A座 | ||
法律状态 | - |
摘要
摘要 | 本发明公开一种基于文本内容数据清洗的语音合成播报系统,所述的播报系统包括:信息存储模块、信息归类模块、关键词组提取模块、权重设置模块、敏感信息过滤模块、广告软文过滤模块;进入服务端的文本数据清洗的过程是依次进行关键词组提取、权重设置、敏感信息过滤、广告软文过滤、重复文本过滤,最后将经过过滤清洗完毕的文本存储到服务器中,调用音频合成接口,将清洗完毕的文本转换为音频文件,存储在音频服务器中,当客户端发起请求时,发送该音频到客户端。 |
