OCR识别模型训练方法、装置以及计算机可读存储介质

基本信息

申请号 CN202110485412.9 申请日 -
公开(公告)号 CN113159212A 公开(公告)日 2021-07-23
申请公布号 CN113159212A 申请公布日 2021-07-23
分类号 G06K9/62(2006.01)I;G06K9/20(2006.01)I 分类 计算;推算;计数;
发明人 邹锦富;杨皓 申请(专利权)人 上海云从企业发展有限公司
代理机构 北京瀚仁知识产权代理事务所(普通合伙) 代理人 屠晓旭;宋宝库
地址 201203上海市浦东新区中国(上海)自由贸易试验区祖冲之路1077号2幢1135-A室
法律状态 -

摘要

摘要 本发明涉及机器学习技术领域,具体提供了一种OCR识别模型训练方法、装置及计算机可读存储介质,旨在解决如何便捷且高效地进行图像样本标签标注,以快速完成OCR识别模型的模型训练的技术问题。为此目的,本发明实施例的OCR识别模型训练方法包括:获取有标签数据的第一类图像样本;采用第一类图像样本训练预设的OCR识别模型,获取初始OCR识别模型;利用初始OCR识别模型识别无标签数据的第二类图像样本中的业务数据;根据识别结果生成标签数据,对第二类图像样本进行标签标注;采用第一类图像样本和标注后的第二类图像样本训练初始OCR识别模型,获取最终OCR识别模型。基于上述实施方式,使OCR识别模型能够快速地完成模型训练,提升图像样本的标注准确度。