基于年龄向量的语音识别方法、装置及设备
基本信息
申请号 | CN202210055243.X | 申请日 | - |
公开(公告)号 | CN114582326A | 公开(公告)日 | 2022-06-03 |
申请公布号 | CN114582326A | 申请公布日 | 2022-06-03 |
分类号 | G10L15/06;G10L15/02;G10L15/22;G10L15/30 | 分类 | 乐器;声学; |
发明人 | 秦艳姣;杨莉;王海军;雷建军 | 申请(专利权)人 | 湖北第二师范学院 |
代理机构 | 武汉知产时代知识产权代理有限公司 | 代理人 | 马帅 |
地址 | 430205 湖北省武汉市东湖新技术开发区高新二路129号 | ||
法律状态 | - |
摘要
摘要 | 本发明提供一种基于年龄向量的语音识别方法、装置及设备,该方法包括:获取训练数据,训练数据包括多条语音文件及对应的标注,标注为语音文件对应的年龄和性别;获取预设的说话人年龄向量提取器;通过训练数据对说话人年龄向量提取器进行多轮迭代训练,训练完成后,得到训练好的说话人年龄向量提取器;获取说话人语音;将说话人语音输入训练好的说话人年龄向量提取器,输出说话人年龄向量;将说话人年龄向量和说话人语音输入预设的声学模型网络,输出语音识别结果。本发明通过训练说话人年龄向量提取器提取说话人年龄向量,同时根据说话人年龄向量和说话人语音综合进行语音识别预测,能够识别不同年龄段的语音,且提高了语音识别的准确率。 |
