一种基于深度学习的OCR方法
基本信息
申请号 | CN201811257203.3 | 申请日 | - |
公开(公告)号 | CN109376658A | 公开(公告)日 | 2019-02-22 |
申请公布号 | CN109376658A | 申请公布日 | 2019-02-22 |
分类号 | G06K9/00;G06K9/32;G06K9/62 | 分类 | 计算;推算;计数; |
发明人 | 王慜骊;林路;桂晓雷;安通鉴;林康;陈立强 | 申请(专利权)人 | 安徽省信雅达软件工程有限公司 |
代理机构 | 杭州求是专利事务所有限公司 | 代理人 | 贾玉霞;邱启旺 |
地址 | 310051 浙江省杭州市滨江区江南大道3888号信雅达科技大厦 | ||
法律状态 | - |
摘要
摘要 | 本发明公开了一种基于深度学习的OCR方法,包含如下步骤:获取待识别图像;对待识别图像进行缩放,然后对缩放后的图像进行预处理,所述的预处理为锐化、灰度化、二值化、矫正倾斜、降噪、去公章中的任意一项或多项;将预处理后的图像放入深度学习神经网络中,得到缩放处理后图像的多个候选文本区域;将缩放处理后图像的多个候选文本区域放入基于深度学习神经网络中,将候选文字区域中的内容转换为计算机可读的文本;将上述计算机可读的文本放入深度学习语言模型中,对文本识别结果进行校正。本发明可以实现影像的文字内容的智能提取,为各行业人员提供了快速检索以及快速获取信息的服务,提升了工作效率,识别字段准确率高,提高处理速度。 |
