一种语音基元的解码方法
基本信息
申请号 | CN201010215141.7 | 申请日 | - |
公开(公告)号 | CN102314879A | 公开(公告)日 | 2012-01-11 |
申请公布号 | CN102314879A | 申请公布日 | 2012-01-11 |
分类号 | G10L19/00(2006.01)I;G10L13/00(2006.01)I;G10L19/08(2006.01)I | 分类 | 乐器;声学; |
发明人 | 孟智平 | 申请(专利权)人 | 上海视加信息科技有限公司 |
代理机构 | - | 代理人 | - |
地址 | 200051 上海市长宁区天山路789号长房国际西楼1004室 | ||
法律状态 | - |
摘要
摘要 | 本发明公开了一种语音基元的解码方法,可用于低带宽高音质的语音传输。本发明在数字语音传输的基础上,以构建的语音基元为编码对象,建立语音基元模型库,把语音基元用统一的方法和编码进行表示,从而进一步合成语音。该方法首先通过对日常语音的分析,采用聚类算法构建语音基元模型库;然后,利用语音基元自动切分算法,对获得的连续语音流进行语音基元的自动切分,并提取语音基元MFCC特征,通过与语音基元模型库中的语音基元进行匹配识别,获得语音基元所对应的编号,以编号代替语音基元进行编码。在合成语音过程中,通过编号从语音基元模型库中取出该编号所对应的语音基元,并通过数学变换对语音基元的频谱包络进行插值拟合等处理,形成平滑过度的语音。 |
