文本纠错方法及相关设备
基本信息
申请号 | CN202111629155.8 | 申请日 | - |
公开(公告)号 | CN114330303A | 公开(公告)日 | 2022-04-12 |
申请公布号 | CN114330303A | 申请公布日 | 2022-04-12 |
分类号 | G06F40/232(2020.01)I;G06F40/242(2020.01)I;G06F40/289(2020.01)I | 分类 | 计算;推算;计数; |
发明人 | 朵思惟;余梓飞;张程华;张艳丽 | 申请(专利权)人 | 天津汇智星源信息技术有限公司 |
代理机构 | 北京风雅颂专利代理有限公司 | 代理人 | 朱智勇 |
地址 | 300384天津市滨海新区华苑产业区开华道22号5号楼西塔2001-2008室 | ||
法律状态 | - |
摘要
摘要 | 本申请提供一种文本纠错方法及相关设备,包括:获取待纠错文本;通过分词算法对所述待纠错文本进行分词,得到分词纠错文本;分别对所述待纠错文本和所述分词纠错文本进行错误检测,以得到错误候选集合,所述错误候选集合包括错误字词;基于所述错误候选集合确定替换候选集合;对所述错误候选集合进行分组,以得到多个错误候选子集合;基于多个所述错误候选子集合生成多个候选路径;基于所述替换候选集合和所述候选路径确定候选推荐集合;基于所述推荐候选集合通过预设算法得到推荐文本。本申请提供的文本纠错方法能够覆盖所有纠错路径和候选可能,提高文本纠错的正确率。 |
