文本纠错方法、装置、存储介质及电子设备

基本信息

申请号 CN202110470228.7 申请日 -
公开(公告)号 CN113515934A 公开(公告)日 2021-10-19
申请公布号 CN113515934A 申请公布日 2021-10-19
分类号 G06F40/253(2020.01)I;G06F40/232(2020.01)I;G06F40/289(2020.01)I;G06K9/62(2006.01)I 分类 计算;推算;计数;
发明人 陶俊杰;张晓雷;杨翕雯;时静一;邱伟伟 申请(专利权)人 新东方教育科技集团有限公司
代理机构 北京英创嘉友知识产权代理事务所(普通合伙) 代理人 李柯莹
地址 100080北京市海淀区海淀中街6号9层
法律状态 -

摘要

摘要 本公开涉及一种文本纠错方法、装置、存储介质及电子设备,无需丰富的先验知识和大量的人力来构建规则,实现对文本的自动纠错。该方法包括:获取原始文本;所述原始文本输入纠错模型中,得到所述纠错模型输出所述原始文本的纠错标签序列,其中,所述纠错模型通过训练样本进行训练得到的,所述训练样本包括待纠错文本和作为所述待纠错文本的标签的文本纠错标签序列,所述纠错标签序列为所述原始文本转换为目标文本的转换条件;根据所述纠错标签序列对所述原始文本进行纠错处理,得到目标文本。