一种中文纠错方法、装置、设备以及可读存储介质

基本信息

申请号 CN201911392614.8 申请日 -
公开(公告)号 CN113128224A 公开(公告)日 2021-07-16
申请公布号 CN113128224A 申请公布日 2021-07-16
分类号 G06F40/295(2020.01)I;G06F16/36(2019.01)I;G06N5/04(2006.01)I 分类 计算;推算;计数;
发明人 余宙;杨永智;王旭 申请(专利权)人 北京阿博茨科技有限公司
代理机构 国浩律师(南京)事务所 代理人 孟睿;孔剑凡
地址 100194北京市海淀区苏家坨镇西小营南环10号院1幢1115号邮编
法律状态 -

摘要

摘要 本发明涉及一种中文纠错方法、装置、设备以及可读存储介质。对原始语句进行分词;使用词嵌入方法,将分词后的词语转换成词向量;Bi‑LSTM_CRF错误检测模块和GNN错误检测模块分别根据输入的词向量给出输出的词向量;输出的词向量包括各分词后词语对应的修正性推荐词语,以及每个修正性推荐词语的评分;使用最优修正性推荐词语对原始语句进行修正,获得修正后语句,将修正后语句送入知识图谱校验模块进行校验,如果校验通过,则使用修正后语句替代原始语句,如果校验未能通过,则放弃修正后语句。本发明扩大了纠错覆盖率,提高了纠错准确率。