口语发音质量评价方法、装置、设备及存储介质
基本信息
申请号 | CN202011480460.0 | 申请日 | - |
公开(公告)号 | CN112700795A | 公开(公告)日 | 2021-04-23 |
申请公布号 | CN112700795A | 申请公布日 | 2021-04-23 |
分类号 | G10L25/60;G10L25/30 | 分类 | 乐器;声学; |
发明人 | 蒋国雷;李坤;刘鹏飞;廖春红 | 申请(专利权)人 | 深圳市声希科技有限公司 |
代理机构 | 深圳市恒程创新知识产权代理有限公司 | 代理人 | 刘冰 |
地址 | 518000 广东省深圳市新安街道兴东社区留仙大道2号汇聚创新园2栋2710 | ||
法律状态 | - |
摘要
摘要 | 本发明属于语音识别技术领域,公开了一种口语发音质量评价方法、装置、设备及存储介质。该方法包括:获取待测试人员的多条句子级语音信号;根据所述句子级语音信号确定一一对应的句子级后验概率分布分数;将所述句子级后验概率分布分数通过训练好的预设质量评价神经网络进行质量评价,得到所述待测试人员的口语发音质量评价结果。通过上述方式,根据说话人的多条句子级语音信号确定句子级后验概率分布分数,多条句子级后验概率分布分数作为说话人级别的特征,包含说话人发音的详细信息以及发音优度,更具有解释性,引用训练好的预设质量评价神经网络对多条句子级后验概率分布分数进行质量评价,提高了口音分类的精度以及稳定性。 |
