端到端的智能语音朗读评测方法
基本信息
申请号 | CN202010627043.8 | 申请日 | - |
公开(公告)号 | CN111883176A | 公开(公告)日 | 2020-11-03 |
申请公布号 | CN111883176A | 申请公布日 | 2020-11-03 |
分类号 | G10L25/51(2013.01)I | 分类 | 乐器;声学; |
发明人 | 张展;王曰海 | 申请(专利权)人 | 绍兴市科技创业投资有限公司 |
代理机构 | 杭州君度专利代理事务所(特殊普通合伙) | 代理人 | 浙江大学绍兴微电子研究中心;浙江大学;绍兴市科技创业投资有限公司 |
地址 | 312000浙江省绍兴市越城区皋埠镇银桥路326号 | ||
法律状态 | - |
摘要
摘要 | 本发明公开了端到端的智能语音朗读评测方法,包括:收集用于训练评测神经网络的朗读语音、目标发音、错误代码、说话人信息的数据处理流程;针对说话人特征,对评测神经网络进行辅助训练;根据待评测的目标发音与待评测发音,直接由神经网络端到端输出评测结果,从输入目标发音与待评测发音,到输出评测结果,整个流程可微分,可直接针对评测指标进行优化。本发明直接构建输入为语音和待评测文本、输出为反馈结果的端到端评测模式,可与方法中的各个模块联合训练使得整体效果更好,另外该方法构建的辅助任务能够更准确的提取评测相关特征,使得反馈的评测结果更为准确。 |
