一种数据标注方法、装置、设备及可读存储介质

基本信息

申请号 CN202110741584.8 申请日 -
公开(公告)号 CN113421543A 公开(公告)日 2021-09-21
申请公布号 CN113421543A 申请公布日 2021-09-21
分类号 G10L13/02(2013.01)I;G10L13/08(2013.01)I 分类 乐器;声学;
发明人 陈百灵;刘云峰;汶林丁 申请(专利权)人 深圳追一科技有限公司
代理机构 北京集佳知识产权代理有限公司 代理人 王云晓
地址 518000广东省深圳市南山区粤海街道科技园社区科苑路8号讯美科技广场3号楼23A、23B
法律状态 -

摘要

摘要 本申请公开了一种数据标注方法、装置、设备及可读存储介质。本申请在获取到相互对应的音频数据和文本数据后,将音频数据用音频波形图和基频线图表示,然后识别音频数据中的静音片段和音高重置片段;最后将静音片段在文本数据中对应的文本标注为语调短语,将音高重置片段在文本数据中对应的文本标注为韵律短语,从而标注出了文本中的自然语感和韵律,据此训练TTS模型,可以使TTS模型学习人说话时的自然语感和韵律,避免TTS模型输出的语音机械感较重。相应地,本申请提供的一种数据标注装置、设备及可读存储介质,也同样具有上述技术效果。