迭代式大规模发音词典构建方法及装置
基本信息
申请号 | CN202110178948.6 | 申请日 | - |
公开(公告)号 | CN112530414A | 公开(公告)日 | 2021-03-19 |
申请公布号 | CN112530414A | 申请公布日 | 2021-03-19 |
分类号 | G10L15/06(2013.01)I;G10L15/02(2006.01)I;G10L15/16(2006.01)I | 分类 | 乐器;声学; |
发明人 | 王治愚;王大亮;王丽媛;齐红威 | 申请(专利权)人 | 数据堂(北京)科技股份有限公司 |
代理机构 | 北京三友知识产权代理有限公司 | 代理人 | 侯天印;郝博 |
地址 | 100192北京市海淀区宝盛南路1号院11号楼1层101-01 | ||
法律状态 | - |
摘要
摘要 | 本发明公开了一种迭代式大规模发音词典构建方法及装置,其中该方法包括:根据文本生数据生成词条序列;根据音频生数据生成音标序列;根据词条序列,利用G2P模型生成二元组<词条,音标>;根据音标序列,利用P2G模型生成二元组<音标,词条>;计算两个二元组之间的匹配度,并与预设匹配度进行比较,对匹配度小于预设匹配度对应的二元组<词条,音标>和二元组<音标,词条>进行鉴别性样本抽取,获得鉴别性样本;获取领域专家对鉴别性样本的标注和校正,将标注和校正后的二元组<词条,音标>和二元组<音标,词条>存入多层次大规模发音词典。本发明能够快速有效地构建大规模发音词典,提升语音识别系统的工作效率并降低人工成本。 |
