一种文本纠错方法和装置

基本信息

申请号 CN202011261361.3 申请日 -
公开(公告)号 CN112464650A 公开(公告)日 2021-03-09
申请公布号 CN112464650A 申请公布日 2021-03-09
分类号 G06F40/232(2020.01)I;G06F40/216(2020.01)I 分类 计算;推算;计数;
发明人 吴高升;李晶;尹大胐;王咏刚 申请(专利权)人 创新工场(北京)企业管理股份有限公司
代理机构 北京启坤知识产权代理有限公司 代理人 李琛
地址 100080北京市海淀区海淀大街3号2幢11楼
法律状态 -

摘要

摘要 本发明的目的是提供一种文本纠错方法和装置。所述方法包括以下步骤:基于输入文本,生成输入至待训练模型的错误文本;基于所述错误文本进行预训练和微调,从而对所述待训练模型进行文本错误位置检测的训练;基于所述错误文本进行遮罩训练,从而对所述待训练模型进行文本错误纠正的训练。本申请实施例具有以下优点:通过进行检测错误位置和纠正错误位置的训练,能够定位错误位置并准确地进行纠错;通过在进行文本错误位置检测的训练中进行预训练和微调,提升了模型的泛化能力,降低了漏检率,使得最终训练出来的模型具有较好的鲁棒性。