一种数据标注方法、装置、设备及可读存储介质
基本信息
申请号 | CN202110741584.8 | 申请日 | - |
公开(公告)号 | CN113421543A | 公开(公告)日 | 2021-09-21 |
申请公布号 | CN113421543A | 申请公布日 | 2021-09-21 |
分类号 | G10L13/02(2013.01)I;G10L13/08(2013.01)I | 分类 | 乐器;声学; |
发明人 | 陈百灵;刘云峰;汶林丁 | 申请(专利权)人 | 深圳追一科技有限公司 |
代理机构 | 北京集佳知识产权代理有限公司 | 代理人 | 王云晓 |
地址 | 518000广东省深圳市南山区粤海街道科技园社区科苑路8号讯美科技广场3号楼23A、23B | ||
法律状态 | - |
摘要
摘要 | 本申请公开了一种数据标注方法、装置、设备及可读存储介质。本申请在获取到相互对应的音频数据和文本数据后,将音频数据用音频波形图和基频线图表示,然后识别音频数据中的静音片段和音高重置片段;最后将静音片段在文本数据中对应的文本标注为语调短语,将音高重置片段在文本数据中对应的文本标注为韵律短语,从而标注出了文本中的自然语感和韵律,据此训练TTS模型,可以使TTS模型学习人说话时的自然语感和韵律,避免TTS模型输出的语音机械感较重。相应地,本申请提供的一种数据标注装置、设备及可读存储介质,也同样具有上述技术效果。 |
