输入法词频调整方法及装置

基本信息

申请号 CN202110357086.3 申请日 -
公开(公告)号 CN113177403A 公开(公告)日 2021-07-27
申请公布号 CN113177403A 申请公布日 2021-07-27
分类号 G06F40/216(2020.01)I;G06F3/023(2006.01)I;G06F40/289(2020.01)I 分类 计算;推算;计数;
发明人 沈哲吉;贾昌鑫;朱相宇;王映新 申请(专利权)人 北京华宇信息技术有限公司
代理机构 北京中索知识产权代理有限公司 代理人 胡大成
地址 100084北京市海淀区中关村东路1号院8号楼21层C2301、C2302
法律状态 -

摘要

摘要 本申请公开了一种输入法词频调整方法及装置,用以解决输入法词组词频调整效果差的技术问题。一种输入法词频调整方法,包括以下步骤:获取语料数据;通过分词模型,对所述语料数据进行分词,生成若干分词单元;通过识音模型,对所述分词单元进行注音,生成分词单元音节;将音节相同的分词单元保存至同一音节词库;统计同一音节词库中第一分词单元的出现概率;将所述第一分词单元的出现概率与预设阈值进行比较,得到比较结果;根据比较结果,调整第一分词单元的词频;根据调整后所述第一分词单元的词频,以预设顺序排列第一分词单元所在音节词库的分词单元顺序,更新音节词库。通过对同一音节词库中词组的词频进行动态调整,提高了输入的准确性。