一种文本纠错方法和装置
基本信息
申请号 | CN202011261361.3 | 申请日 | - |
公开(公告)号 | CN112464650A | 公开(公告)日 | 2021-03-09 |
申请公布号 | CN112464650A | 申请公布日 | 2021-03-09 |
分类号 | G06F40/232(2020.01)I;G06F40/216(2020.01)I | 分类 | 计算;推算;计数; |
发明人 | 吴高升;李晶;尹大胐;王咏刚 | 申请(专利权)人 | 创新工场(北京)企业管理股份有限公司 |
代理机构 | 北京启坤知识产权代理有限公司 | 代理人 | 李琛 |
地址 | 100080北京市海淀区海淀大街3号2幢11楼 | ||
法律状态 | - |
摘要
摘要 | 本发明的目的是提供一种文本纠错方法和装置。所述方法包括以下步骤:基于输入文本,生成输入至待训练模型的错误文本;基于所述错误文本进行预训练和微调,从而对所述待训练模型进行文本错误位置检测的训练;基于所述错误文本进行遮罩训练,从而对所述待训练模型进行文本错误纠正的训练。本申请实施例具有以下优点:通过进行检测错误位置和纠正错误位置的训练,能够定位错误位置并准确地进行纠错;通过在进行文本错误位置检测的训练中进行预训练和微调,提升了模型的泛化能力,降低了漏检率,使得最终训练出来的模型具有较好的鲁棒性。 |
