用于语音合成语料库的建立方法、装置、设备和介质专利查询专利号|摘要-满商公司网

请输入想查询的关键字

查询

退出

头部vip图标

浏览历史

清除

首页/ 深圳云知声信息技术有限公司/ 专利详情

用于语音合成语料库的建立方法、装置、设备和介质

基本信息

申请号	CN202110616148.8	申请日	-
公开（公告）号	CN113362800A	公开（公告）日	2021-09-07
申请公布号	CN113362800A	申请公布日	2021-09-07
分类号	G10L13/02（2013.01）I;G10L13/04（2013.01）I;G10L15/26（2006.01）I	分类	乐器；声学;
发明人	石强;孙见青;梁家恩	申请（专利权）人	深圳云知声信息技术有限公司
代理机构	-	代理人	-
地址	518057广东省深圳市南山区西丽街道朗山路11号同方信息港C栋6A
法律状态	-

摘要

摘要	本发明涉及一种用于语音合成语料库的建立方法、装置、设备和介质，该方法包括：获取第一文本以及第一文本对应的语音数据；切分语音数据得到分割语料；所述分割语料得到第二文本；对比第二文本和第一文本，筛选得到筛选文本；根据筛选文本确定筛选音频；提取筛选音频的基频值；计算基频值的均值和方差；聚类均值和方差得到聚类结果；根据聚类结果将筛选文本及其对应的语音数据分成k个语料库。本申请实施例中采取先切分后识别的方式，可以提高文本识别准确率，并且将获取得到的第一文本作为参考去除识别错误的情况；由于基频与语音风格和音色具有强相关性，使用句子级的基频均值方差进行分类，有效的保证类内语音风格与音色的一致性。