多音字消歧方法、装置、系统及存储介质
基本信息
申请号 | CN202110577910.6 | 申请日 | - |
公开(公告)号 | CN113380223A | 公开(公告)日 | 2021-09-10 |
申请公布号 | CN113380223A | 申请公布日 | 2021-09-10 |
分类号 | G10L13/08(2013.01)I;G10L13/04(2013.01)I | 分类 | 乐器;声学; |
发明人 | 张海腾;李秀林 | 申请(专利权)人 | 标贝(北京)科技有限公司 |
代理机构 | 北京睿邦知识产权代理事务所(普通合伙) | 代理人 | 徐丁峰;戴亚南 |
地址 | 100192北京市海淀区西小口路66号中关村东升科技园·北领地B-2楼3层B303A | ||
法律状态 | - |
摘要
摘要 | 本发明提供一种多音字消歧方法、装置、系统及存储介质。方法包括:获取待处理文本;从待处理文本中识别目标多音字字符;从待处理文本中识别一个或多个目标词,一个或多个目标词中的每一个包含目标多音字字符;利用多音字词典确定与一个或多个目标词一一对应的一组或多组字符发音信息,每组字符发音信息用于表示在对应目标词中目标多音字字符的发音,多音字词典用于记录至少一个多音字字符中的每个多音字字符在包含该多音字字符的多个词中的发音;至少基于一组或多组字符发音信息生成输入特征;将输入特征输入多音字消歧模型,以获得目标多音字字符的预测发音结果。有助于提高多音字消歧的处理效率和预测准确率。 |
