将中英混合及语气标签化的数据标注方法及装置
基本信息
申请号 | CN201911404092.9 | 申请日 | - |
公开(公告)号 | CN111145719A | 公开(公告)日 | 2020-05-12 |
申请公布号 | CN111145719A | 申请公布日 | 2020-05-12 |
分类号 | G10L13/02;G10L13/033;G10L15/06;G10L15/26;G10L25/30 | 分类 | 乐器;声学; |
发明人 | 戴健 | 申请(专利权)人 | 北京太极华保科技股份有限公司 |
代理机构 | 北京善任知识产权代理有限公司 | 代理人 | 北京太极华保科技股份有限公司 |
地址 | 102200 北京市昌平区科技园区创新路27号 | ||
法律状态 | - |
摘要
摘要 | 本申请实施例公开了一种应用在深度学习语音合成算法中的,将中英混合及语气标签化的数据标注方法及装置,所述方法包括:从数据源中抓取训练文本,所述训练文本涵盖有中英文字符;为所抓取的所述训练文本添加情感标签,记录发音人根据情感标签标注后的训练文本的朗读音频文件,作为训练用音频文件;核检训练用音频文件与对应的训练文本的情感标签是否一致,不一致的部分对音频文件进行修订;将训练文本映射为文本向量,将文本向量及发音人的朗读音频文件,提交给神经网络的深度学习引擎进行训练,通过深度学习训练,学习中文、英文、情感标签的各种组合搭配下的文本的发音特点。 |
