一种基于文本内容数据清洗的语音合成播报系统

基本信息

申请号 CN201910901689.8 申请日 -
公开(公告)号 CN110767211A 公开(公告)日 2020-02-07
申请公布号 CN110767211A 申请公布日 2020-02-07
分类号 G10L13/08;G06F40/289 分类 乐器;声学;
发明人 李蜜;丁超;胡晓伟 申请(专利权)人 浙江斑智科技有限公司
代理机构 广州辰联知识产权代理有限公司 代理人 浙江从泰网络科技有限公司
地址 310012 浙江省杭州市余杭区创鑫时代广场3幢A座
法律状态 -

摘要

摘要 本发明公开一种基于文本内容数据清洗的语音合成播报系统,所述的播报系统包括:信息存储模块、信息归类模块、关键词组提取模块、权重设置模块、敏感信息过滤模块、广告软文过滤模块;进入服务端的文本数据清洗的过程是依次进行关键词组提取、权重设置、敏感信息过滤、广告软文过滤、重复文本过滤,最后将经过过滤清洗完毕的文本存储到服务器中,调用音频合成接口,将清洗完毕的文本转换为音频文件,存储在音频服务器中,当客户端发起请求时,发送该音频到客户端。