基于年龄向量的语音识别方法、装置及设备

基本信息

申请号 CN202210055243.X 申请日 -
公开(公告)号 CN114582326A 公开(公告)日 2022-06-03
申请公布号 CN114582326A 申请公布日 2022-06-03
分类号 G10L15/06;G10L15/02;G10L15/22;G10L15/30 分类 乐器;声学;
发明人 秦艳姣;杨莉;王海军;雷建军 申请(专利权)人 湖北第二师范学院
代理机构 武汉知产时代知识产权代理有限公司 代理人 马帅
地址 430205 湖北省武汉市东湖新技术开发区高新二路129号
法律状态 -

摘要

摘要 本发明提供一种基于年龄向量的语音识别方法、装置及设备,该方法包括:获取训练数据,训练数据包括多条语音文件及对应的标注,标注为语音文件对应的年龄和性别;获取预设的说话人年龄向量提取器;通过训练数据对说话人年龄向量提取器进行多轮迭代训练,训练完成后,得到训练好的说话人年龄向量提取器;获取说话人语音;将说话人语音输入训练好的说话人年龄向量提取器,输出说话人年龄向量;将说话人年龄向量和说话人语音输入预设的声学模型网络,输出语音识别结果。本发明通过训练说话人年龄向量提取器提取说话人年龄向量,同时根据说话人年龄向量和说话人语音综合进行语音识别预测,能够识别不同年龄段的语音,且提高了语音识别的准确率。