文本识别模型的训练方法、文本识别方法、电子设备、存储介质
基本信息
申请号 | CN202111521025.2 | 申请日 | - |
公开(公告)号 | CN114187594A | 公开(公告)日 | 2022-03-15 |
申请公布号 | CN114187594A | 申请公布日 | 2022-03-15 |
分类号 | G06V30/148(2022.01)I;G06V30/40(2022.01)I;G06K9/62(2022.01)I;G06N3/04(2006.01)I;G06N3/08(2006.01)I;G06V10/82(2022.01)I;G06V30/19(2022.01)I | 分类 | 计算;推算;计数; |
发明人 | 万鸣;王占一;李宁 | 申请(专利权)人 | 奇安信科技集团股份有限公司 |
代理机构 | 成都维飞知识产权代理有限公司 | 代理人 | 张巧燕 |
地址 | 100032北京市西城区新街口外大街28号102号楼3层332号 | ||
法律状态 | - |
摘要
摘要 | 本申请提供一种文本识别模型的训练方法、文本识别方法、电子设备、计算机可读存储介质,方法包括:获取目标文字的多条语料数据;多条语料数据包括RTL文字对应的第一语料数据和LTR文字对应的第二语料数据;根据多种组合方式,对第一语料数据和所述第二语料数据进行组合,获得与每一组合方式对应的组合语料数据;生成与每一组合语料数据对应的样本图片和标签,并基于样本图片和标签构建样本数据;根据样本数据对深度学习模型进行训练,得到文本识别模型。本申请方案,通过生成复杂的双向文本的样本数据,可以训练出对双向文本准确识别的文本识别模型。 |
