一种基于伪说话人聚类的语音情感特征规整化方法
基本信息
申请号 | CN201310534319.8 | 申请日 | - |
公开(公告)号 | CN103531198A | 公开(公告)日 | 2014-01-22 |
申请公布号 | CN103531198A | 申请公布日 | 2014-01-22 |
分类号 | G10L15/02(2006.01)I;G10L25/63(2013.01)I | 分类 | 乐器;声学; |
发明人 | 黄程韦;赵力;魏昕;王浩;查诚;余华 | 申请(专利权)人 | 南京领路鸟物联网科技有限公司 |
代理机构 | 江苏永衡昭辉律师事务所 | 代理人 | 东南大学;南京宇音力新电子科技有限公司;南京博克兴电子科技有限公司 |
地址 | 210096 江苏省南京市四牌楼2号 | ||
法律状态 | - |
摘要
摘要 | 本发明公开了一种基于伪说话人聚类的语音情感特征规整化方法,适合应用于非特定说话人情感识别。本发明首先提取出能够反映说话人信息的特征空间;接着在此特征空间内进行模糊聚类,自动获得情感语料中的说话人的身份信息,据此信息进行“伪说话人”分组,每一条样本按照其相似程度划分到不同的伪说话人分组中;而后根据每条样本的伪说话人组别信息,进行情感特征的规整化;最终在规整化后的数据中加入相应组别的模糊隶属度信息。通过上述处理过程,使得情感特征空间中的样本分布更加清晰有效,降低了大量说话人带来的特征差异,增强了说话人鲁棒性。 |
