基于卷积神经网络深度学习模型的光学字符识别方法

基本信息

申请号 CN201810270374.3 申请日 -
公开(公告)号 CN108681735A 公开(公告)日 2018-10-19
申请公布号 CN108681735A 申请公布日 2018-10-19
分类号 G06K9/34;G06K9/62;G06N3/08 分类 计算;推算;计数;
发明人 陆成学 申请(专利权)人 中科博宏(北京)科技有限公司
代理机构 - 代理人 -
地址 100083 北京市海淀区天秀路10中国农大国际创业园2号楼5层5096
法律状态 -

摘要

摘要 本发明公开一种基于卷积神经网络深度学习模型的光学字符识别方法。该方法包括以下步骤:收集不同字体的常用汉字和10个阿拉伯数字以及26个英文字母数据集并将其转换为图片格式;对图片进行轻微的扭曲和旋转以增强模型的鲁棒性,生成模型训练数据库;建立光学字符识别的深度学习模型;将训练集图像输入模型,使用卷积神经网络模型通过监督学习的方法,不断优化目标函数,学习一个多分类器;对于新来的测试样本,基于上一步得到的模型对其进行特征提取并应用模型分类器得到最终分类结果。本发明对基于卷积神经网络的深度学习在光学字符识别中的应用提出了新的模型和方法,该方法可以应用于一般的模式分类任务中,特别是文本识别问题,本发明提出的基于深度学习的光学字符识别模型可以显著提高字符识别的识别正确率。