输入法词频调整方法及装置
基本信息
申请号 | CN202110357086.3 | 申请日 | - |
公开(公告)号 | CN113177403A | 公开(公告)日 | 2021-07-27 |
申请公布号 | CN113177403A | 申请公布日 | 2021-07-27 |
分类号 | G06F40/216(2020.01)I;G06F3/023(2006.01)I;G06F40/289(2020.01)I | 分类 | 计算;推算;计数; |
发明人 | 沈哲吉;贾昌鑫;朱相宇;王映新 | 申请(专利权)人 | 北京华宇信息技术有限公司 |
代理机构 | 北京中索知识产权代理有限公司 | 代理人 | 胡大成 |
地址 | 100084北京市海淀区中关村东路1号院8号楼21层C2301、C2302 | ||
法律状态 | - |
摘要
摘要 | 本申请公开了一种输入法词频调整方法及装置,用以解决输入法词组词频调整效果差的技术问题。一种输入法词频调整方法,包括以下步骤:获取语料数据;通过分词模型,对所述语料数据进行分词,生成若干分词单元;通过识音模型,对所述分词单元进行注音,生成分词单元音节;将音节相同的分词单元保存至同一音节词库;统计同一音节词库中第一分词单元的出现概率;将所述第一分词单元的出现概率与预设阈值进行比较,得到比较结果;根据比较结果,调整第一分词单元的词频;根据调整后所述第一分词单元的词频,以预设顺序排列第一分词单元所在音节词库的分词单元顺序,更新音节词库。通过对同一音节词库中词组的词频进行动态调整,提高了输入的准确性。 |
