文本识别模型的训练方法、文本识别方法、电子设备、存储介质

基本信息

申请号 CN202111521025.2 申请日 -
公开(公告)号 CN114187594A 公开(公告)日 2022-03-15
申请公布号 CN114187594A 申请公布日 2022-03-15
分类号 G06V30/148(2022.01)I;G06V30/40(2022.01)I;G06K9/62(2022.01)I;G06N3/04(2006.01)I;G06N3/08(2006.01)I;G06V10/82(2022.01)I;G06V30/19(2022.01)I 分类 计算;推算;计数;
发明人 万鸣;王占一;李宁 申请(专利权)人 奇安信科技集团股份有限公司
代理机构 成都维飞知识产权代理有限公司 代理人 张巧燕
地址 100032北京市西城区新街口外大街28号102号楼3层332号
法律状态 -

摘要

摘要 本申请提供一种文本识别模型的训练方法、文本识别方法、电子设备、计算机可读存储介质,方法包括:获取目标文字的多条语料数据;多条语料数据包括RTL文字对应的第一语料数据和LTR文字对应的第二语料数据;根据多种组合方式,对第一语料数据和所述第二语料数据进行组合,获得与每一组合方式对应的组合语料数据;生成与每一组合语料数据对应的样本图片和标签,并基于样本图片和标签构建样本数据;根据样本数据对深度学习模型进行训练,得到文本识别模型。本申请方案,通过生成复杂的双向文本的样本数据,可以训练出对双向文本准确识别的文本识别模型。