将中英混合及语气标签化的数据标注方法及装置

基本信息

申请号 CN201911404092.9 申请日 -
公开(公告)号 CN111145719A 公开(公告)日 2020-05-12
申请公布号 CN111145719A 申请公布日 2020-05-12
分类号 G10L13/02;G10L13/033;G10L15/06;G10L15/26;G10L25/30 分类 乐器;声学;
发明人 戴健 申请(专利权)人 北京太极华保科技股份有限公司
代理机构 北京善任知识产权代理有限公司 代理人 北京太极华保科技股份有限公司
地址 102200 北京市昌平区科技园区创新路27号
法律状态 -

摘要

摘要 本申请实施例公开了一种应用在深度学习语音合成算法中的,将中英混合及语气标签化的数据标注方法及装置,所述方法包括:从数据源中抓取训练文本,所述训练文本涵盖有中英文字符;为所抓取的所述训练文本添加情感标签,记录发音人根据情感标签标注后的训练文本的朗读音频文件,作为训练用音频文件;核检训练用音频文件与对应的训练文本的情感标签是否一致,不一致的部分对音频文件进行修订;将训练文本映射为文本向量,将文本向量及发音人的朗读音频文件,提交给神经网络的深度学习引擎进行训练,通过深度学习训练,学习中文、英文、情感标签的各种组合搭配下的文本的发音特点。