迭代式大规模发音词典构建方法及装置

基本信息

申请号 CN202110178948.6 申请日 -
公开(公告)号 CN112530414B 公开(公告)日 2021-05-25
申请公布号 CN112530414B 申请公布日 2021-05-25
分类号 G10L15/02(2006.01)I;G10L15/06(2013.01)I;G10L15/16(2006.01)I 分类 -
发明人 王治愚;王大亮;王丽媛;齐红威 申请(专利权)人 数据堂(北京)科技股份有限公司
代理机构 北京三友知识产权代理有限公司 代理人 侯天印;郝博
地址 100192北京市海淀区宝盛南路1号院11号楼1层101-01
法律状态 -

摘要

摘要 本发明公开了一种迭代式大规模发音词典构建方法及装置,其中该方法包括:根据文本生数据生成词条序列;根据音频生数据生成音标序列;根据词条序列,利用G2P模型生成二元组<词条,音标>;根据音标序列,利用P2G模型生成二元组<音标,词条>;计算两个二元组之间的匹配度,并与预设匹配度进行比较,对匹配度小于预设匹配度对应的二元组<词条,音标>和二元组<音标,词条>进行鉴别性样本抽取,获得鉴别性样本;获取领域专家对鉴别性样本的标注和校正,将标注和校正后的二元组<词条,音标>和二元组<音标,词条>存入多层次大规模发音词典。本发明能够快速有效地构建大规模发音词典,提升语音识别系统的工作效率并降低人工成本。