一种极短语音语种识别特征提取方法
基本信息
申请号 | CN202110755053.4 | 申请日 | - |
公开(公告)号 | CN113380226A | 公开(公告)日 | 2021-09-10 |
申请公布号 | CN113380226A | 申请公布日 | 2021-09-10 |
分类号 | G10L15/00(2013.01)I;G10L15/20(2006.01)I;G10L25/03(2013.01)I;G10L25/18(2013.01)I | 分类 | 乐器;声学; |
发明人 | 刘俊南;郭鹏;江海;魏欣;齐心 | 申请(专利权)人 | 因诺微科技(天津)有限公司 |
代理机构 | 天津诺德知识产权代理事务所(特殊普通合伙) | 代理人 | 朱卉 |
地址 | 300000天津市滨海新区华苑产业区(环外)海泰发展五道16号B-6号楼-1-502 | ||
法律状态 | - |
摘要
摘要 | 一种极短语音语种识别特征提取方法,所述方法包括步骤:获取输入语音信号;对所述输入语音信号进行预处理;获取基于线性预测系数算法;使用所述基于线性预测系数算法对所述输入语音信号进行特征提取。本申请针对时长1s的极短语音提取语种识别特征进行研究,设计对极短(1s长度)语音语种识别更加鲁棒的特征提取方法,该特征利用频域线性预测系数(FDLP)方法,先使用离散余弦变换(Discrete Cosine Transform,DCT)获得信号的频域等价物,再在频域等价物上利用线性预测(Linear Prediction,LP)分析计算得到语音信号的子带包络信号(Sub‑band Envelop Signal),然后将子带包络信号经过傅里叶变换转化为子带包络的频域信号,然后计算子带包络幅度特征。 |
