一种基于拼接特征的语种识别方法
基本信息
申请号 | CN202010244083.4 | 申请日 | - |
公开(公告)号 | CN111599344A | 公开(公告)日 | 2020-08-28 |
申请公布号 | CN111599344A | 申请公布日 | 2020-08-28 |
分类号 | G10L15/00;G10L15/02;G10L15/06 | 分类 | 乐器;声学; |
发明人 | 刘俊南;江海;王化;刘文龙 | 申请(专利权)人 | 因诺微科技(天津)有限公司 |
代理机构 | 天津市北洋有限责任专利代理事务所 | 代理人 | 李素兰 |
地址 | 300392 天津市滨海新区华苑产业区(环外)海泰发展五道16号B-6号楼-1-502 | ||
法律状态 | - |
摘要
摘要 | 本发明公开了一种基于拼接特征的语种识别方法,步骤1,获得语音信号的帧序列;步骤2,计算时长特征;步骤3,提取语音帧序列的底层声学特征;步骤4,得到音素特征序列;步骤5,获得拼接特征;步骤6,将拼接特征输入到i‑vector提取器中,提取得到语音帧序列的i‑vector特征表示;步骤7,得到lda‑vector特征;步骤8,将lda‑vector特征输入到训练好的分类器中,获得输入语音帧序列的语种标签。与现有技术相比,本发明结合了高层和底层声学特征这两种特征的优点;无需训练多个音素识别器,只需要提取高层声学特征;降低复杂度的同时,提高对语音信号的语种识别性能特别是语种识别准确率。 |
