文本纠错方法、装置及存储介质

基本信息

申请号 CN202110939673.3 申请日 -
公开(公告)号 CN113468871A 公开(公告)日 2021-10-01
申请公布号 CN113468871A 申请公布日 2021-10-01
分类号 G06F40/232(2020.01)I;G06F40/216(2020.01)I;G06N20/10(2019.01)I 分类 计算;推算;计数;
发明人 李罗政;张丹 申请(专利权)人 北京北大方正电子有限公司
代理机构 北京同立钧成知识产权代理有限公司 代理人 刘丹;黄健
地址 100085北京市海淀区上地五街9号方正大厦
法律状态 -

摘要

摘要 本申请提供一种文本纠错方法、装置及存储介质,该方法包括:对待纠错文本进行状态建模,得到状态图,状态图包含多个状态集以及相邻状态集中状态间的距离,状态集中的状态包含一包含于对待纠错文本中的目标字或所述目标字对应的易混淆字;对状态图中至少一目标路径进行搜索,将位于目标路径上的状态作为纠错结果,得到至少一纠错结果,目标路径为路径距离小于距离阈值的路径;根据至少一纠错结果,确定待纠错文本是否存在错误;若待纠错文本存在错误,则根据各纠错结果对待纠错文本的已修改字数,对待纠错文本进行纠错,以提高文本纠错的准确率。