说话人识别网络模型训练方法、说话人识别方法及系统
基本信息
申请号 | CN201810025592.0 | 申请日 | - |
公开(公告)号 | CN108417217B | 公开(公告)日 | 2021-07-13 |
申请公布号 | CN108417217B | 申请公布日 | 2021-07-13 |
分类号 | G10L17/04;G10L17/18 | 分类 | 乐器;声学; |
发明人 | 钱彦旻;黄子砾;王帅 | 申请(专利权)人 | 上海交大知识产权管理有限公司 |
代理机构 | 北京商专永信知识产权代理事务所(普通合伙) | 代理人 | 方挺;车江华 |
地址 | 215123 江苏省苏州市苏州工业园区新平街388号腾飞创新园14栋 | ||
法律状态 | - |
摘要
摘要 | 本发明公开一种说话人识别网络模型训练方法,包括:从训练数据集中获取第i话语三元组并将第i话语三元组输入至卷积神经网络,卷积神经网络对第i话语三元组进行特征提取得到第i话语特征三元组并输入至线性神经网络;将预先获取的第一说话人的第一身份向量信息和第二说话人的第二身份向量信息输入至线性神经网络进行融合处理,以得到融合后的第i话语特征三元组;根据融合后的第i话语特征三元组计算三元组损失,以调整所述网络模型。本发明实施例得到的说话人识别网络模型能够更加准确的实现说话人的识别功能,具有最低的等错误率。 |
