基于深度神经网络后验概率算法的口语发音评测方法
基本信息
申请号 | CN201810179106.0 | 申请日 | - |
公开(公告)号 | CN108364634A | 公开(公告)日 | 2018-08-03 |
申请公布号 | CN108364634A | 申请公布日 | 2018-08-03 |
分类号 | G10L15/00;G10L15/16;G10L15/06;G10L25/51 | 分类 | 乐器;声学; |
发明人 | 徐祥荣 | 申请(专利权)人 | 苏州声通信息科技有限公司 |
代理机构 | 北京商专永信知识产权代理事务所(普通合伙) | 代理人 | 苏州声通信息科技有限公司 |
地址 | 215000 江苏省苏州市工业园区新平街388号腾飞科技园21幢6层06室 | ||
法律状态 | - |
摘要
摘要 | 本发明公开了一种基于深度神经网络后验概率算法的口语发音评测方法。该方法包括以下步骤:从语音中选取一定数量的音频,其中每个音频的单词数量均在一定的范围内,计算各音频中的每个单词的音素的平均似然度、音素的平均EGOP和音素的平均时长概率;并将其作为输入项输入到神经网络,并输出单词的分数。本发明中的基于深度神经网络后验概率算法的口语发音评测方法从声学模型角度出发,利用LSTM建模提升音素识别率,还将FA的似然度和所有相近的音素似然度作对比,将GOP方法扩展为EGOP方法,并采用人工神经网络打分模型进行打分,从而得到准确的语音评测结果。 |
