文本纠错方法及相关设备

基本信息

申请号 CN202111629155.8 申请日 -
公开(公告)号 CN114330303A 公开(公告)日 2022-04-12
申请公布号 CN114330303A 申请公布日 2022-04-12
分类号 G06F40/232(2020.01)I;G06F40/242(2020.01)I;G06F40/289(2020.01)I 分类 计算;推算;计数;
发明人 朵思惟;余梓飞;张程华;张艳丽 申请(专利权)人 天津汇智星源信息技术有限公司
代理机构 北京风雅颂专利代理有限公司 代理人 朱智勇
地址 300384天津市滨海新区华苑产业区开华道22号5号楼西塔2001-2008室
法律状态 -

摘要

摘要 本申请提供一种文本纠错方法及相关设备,包括:获取待纠错文本;通过分词算法对所述待纠错文本进行分词,得到分词纠错文本;分别对所述待纠错文本和所述分词纠错文本进行错误检测,以得到错误候选集合,所述错误候选集合包括错误字词;基于所述错误候选集合确定替换候选集合;对所述错误候选集合进行分组,以得到多个错误候选子集合;基于多个所述错误候选子集合生成多个候选路径;基于所述替换候选集合和所述候选路径确定候选推荐集合;基于所述推荐候选集合通过预设算法得到推荐文本。本申请提供的文本纠错方法能够覆盖所有纠错路径和候选可能,提高文本纠错的正确率。