端到端的智能语音朗读评测方法

基本信息

申请号 CN202010627043.8 申请日 -
公开(公告)号 CN111883176B 公开(公告)日 2022-06-21
申请公布号 CN111883176B 申请公布日 2022-06-21
分类号 G10L25/51;G10L15/26;G10L15/02;G10L15/16;G10L15/06;G06N3/04;G06N3/08 分类 乐器;声学;
发明人 张展;王曰海 申请(专利权)人 绍兴市科技创业投资有限公司
代理机构 杭州君度专利代理事务所(特殊普通合伙) 代理人 徐锋
地址 312000 浙江省绍兴市越城区皋埠镇银桥路326号
法律状态 -

摘要

摘要 本发明公开了端到端的智能语音朗读评测方法,包括:收集用于训练评测神经网络的朗读语音、目标发音、错误代码、说话人信息的数据处理流程;针对说话人特征,对评测神经网络进行辅助训练;根据待评测的目标发音与待评测发音,直接由神经网络端到端输出评测结果,从输入目标发音与待评测发音,到输出评测结果,整个流程可微分,可直接针对评测指标进行优化。本发明直接构建输入为语音和待评测文本、输出为反馈结果的端到端评测模式,可与方法中的各个模块联合训练使得整体效果更好,另外该方法构建的辅助任务能够更准确的提取评测相关特征,使得反馈的评测结果更为准确。