一种音素自动切分方法

基本信息

申请号 CN201010215095.0 申请日 -
公开(公告)号 CN102314878A 公开(公告)日 2012-01-11
申请公布号 CN102314878A 申请公布日 2012-01-11
分类号 G10L19/00(2006.01)I 分类 乐器;声学;
发明人 孟智平 申请(专利权)人 上海视加信息科技有限公司
代理机构 - 代理人 -
地址 200051 上海市长宁区天山路789号长房国际西楼1004室
法律状态 -

摘要

摘要 本发明公开了一种音素自动切分方法,可用于低带宽高音质的语音传输。本发明在数字语音传输的基础上,以构建的语音基元为编码对象,建立语音基元模型库,把语音基元用统一的方法和编码进行表示,从而进一步合成语音。该方法首先通过对日常语音的分析,采用聚类算法构建语音基元模型库;然后,利用语音基元自动切分算法,对获得的连续语音流进行语音基元的自动切分,并提取语音基元MFCC特征,通过与语音基元模型库中的语音基元进行匹配识别,获得语音基元所对应的编号,以编号代替语音基元进行编码。在合成语音过程中,通过编号从语音基元模型库中取出该编号所对应的语音基元,并通过数学变换对语音基元的频谱包络进行插值拟合等处理,形成平滑过度的语音。