一种人声识别算法
基本信息
申请号 | CN201910272975.2 | 申请日 | - |
公开(公告)号 | CN110033757A | 公开(公告)日 | 2019-07-19 |
申请公布号 | CN110033757A | 申请公布日 | 2019-07-19 |
分类号 | G10L15/02;G10L15/16;G10L21/0208 | 分类 | 乐器;声学; |
发明人 | 史程;彭加木 | 申请(专利权)人 | 行知技术有限公司 |
代理机构 | 南京常青藤知识产权代理有限公司 | 代理人 | 行知技术有限公司;李东明 |
地址 | 210000 江苏省南京市江宁区秣陵街道秣周东路12号 | ||
法律状态 | - |
摘要
摘要 | 本发明提供一种人声识别算法,包括以下步骤:S1:对说话人声音音量大小的自适应处理,将说话人的声音音量大小进行识别模型训练后做总体归一化处理到相同的最大值;S2:对说话人声音静音区的自适应处理,通过均值滤波判断出当前说话人的音量数值大小,再通过阈值过滤掉静音的区域;S3:对背景音滤波降噪,并对说话人声音数据做一致性处理;S4:提取说话人的声音特征,通过训练好的神经网络算法模型,提取说话人声音的高维特征向量;S5:对说话人的声音特征与声纹库进行比对识别,利用余弦距离比对神经网络算法模型提取的高维特征,获取说话人特征的相似度。本发明对说话人的声音特征进行直接辨识,噪声小,算法精度高。 |
