OCR识别模型训练方法、装置以及计算机可读存储介质
基本信息
申请号 | CN202110485412.9 | 申请日 | - |
公开(公告)号 | CN113159212A | 公开(公告)日 | 2021-07-23 |
申请公布号 | CN113159212A | 申请公布日 | 2021-07-23 |
分类号 | G06K9/62(2006.01)I;G06K9/20(2006.01)I | 分类 | 计算;推算;计数; |
发明人 | 邹锦富;杨皓 | 申请(专利权)人 | 上海云从企业发展有限公司 |
代理机构 | 北京瀚仁知识产权代理事务所(普通合伙) | 代理人 | 屠晓旭;宋宝库 |
地址 | 201203上海市浦东新区中国(上海)自由贸易试验区祖冲之路1077号2幢1135-A室 | ||
法律状态 | - |
摘要
摘要 | 本发明涉及机器学习技术领域,具体提供了一种OCR识别模型训练方法、装置及计算机可读存储介质,旨在解决如何便捷且高效地进行图像样本标签标注,以快速完成OCR识别模型的模型训练的技术问题。为此目的,本发明实施例的OCR识别模型训练方法包括:获取有标签数据的第一类图像样本;采用第一类图像样本训练预设的OCR识别模型,获取初始OCR识别模型;利用初始OCR识别模型识别无标签数据的第二类图像样本中的业务数据;根据识别结果生成标签数据,对第二类图像样本进行标签标注;采用第一类图像样本和标注后的第二类图像样本训练初始OCR识别模型,获取最终OCR识别模型。基于上述实施方式,使OCR识别模型能够快速地完成模型训练,提升图像样本的标注准确度。 |
