语音语料库的构建方法和系统

基本信息

申请号 CN201310116396.1 申请日 -
公开(公告)号 CN103198828B 公开(公告)日 2015-09-23
申请公布号 CN103198828B 申请公布日 2015-09-23
分类号 G10L15/06(2013.01)I;G10L15/30(2013.01)I 分类 乐器;声学;
发明人 江南;陈德全 申请(专利权)人 中金数据集团有限公司
代理机构 北京三聚阳光知识产权代理有限公司 代理人 寇海侠
地址 100176 北京市大兴区北京经济技术开发区博兴八路1号
法律状态 -

摘要

摘要 本发明的语音语料库的构建方法和系统,通过语音录入客户端实现语音语料的采集,进而通过网络传输给服务器,使得语音语料的采集可以随时随地进行,无需专门的录音棚和专门的录音设备,借用现有的网络即可实现,语音语料的获取成本大大降低;同时,语音语料是用于后续语音识别的,识别的语音均在平时的生活环境中生成,要识别的录音自然会有周围环境的噪音,如果语音语料仅在录音棚中生成,反而脱离了实际生活,不利于实际生活场景中语音的识别。本发明的语音语料库的构建方法和系统,在减少成本的基础上,更使得语音语料更接近实际场景中的语音,提高实际场景中语音的识别率。