一种中文纠错方法、装置、设备以及可读存储介质
基本信息
申请号 | CN201911392614.8 | 申请日 | - |
公开(公告)号 | CN113128224A | 公开(公告)日 | 2021-07-16 |
申请公布号 | CN113128224A | 申请公布日 | 2021-07-16 |
分类号 | G06F40/295(2020.01)I;G06F16/36(2019.01)I;G06N5/04(2006.01)I | 分类 | 计算;推算;计数; |
发明人 | 余宙;杨永智;王旭 | 申请(专利权)人 | 北京阿博茨科技有限公司 |
代理机构 | 国浩律师(南京)事务所 | 代理人 | 孟睿;孔剑凡 |
地址 | 100194北京市海淀区苏家坨镇西小营南环10号院1幢1115号邮编 | ||
法律状态 | - |
摘要
摘要 | 本发明涉及一种中文纠错方法、装置、设备以及可读存储介质。对原始语句进行分词;使用词嵌入方法,将分词后的词语转换成词向量;Bi‑LSTM_CRF错误检测模块和GNN错误检测模块分别根据输入的词向量给出输出的词向量;输出的词向量包括各分词后词语对应的修正性推荐词语,以及每个修正性推荐词语的评分;使用最优修正性推荐词语对原始语句进行修正,获得修正后语句,将修正后语句送入知识图谱校验模块进行校验,如果校验通过,则使用修正后语句替代原始语句,如果校验未能通过,则放弃修正后语句。本发明扩大了纠错覆盖率,提高了纠错准确率。 |
