一种基于深度学习优化网络的图文识别方法及系统
基本信息
申请号 | CN202011178476.6 | 申请日 | - |
公开(公告)号 | CN112348024A | 公开(公告)日 | 2021-02-09 |
申请公布号 | CN112348024A | 申请公布日 | 2021-02-09 |
分类号 | G06K9/34(2006.01)I; | 分类 | 计算;推算;计数; |
发明人 | 戴亦斌 | 申请(专利权)人 | 北京信工博特智能科技有限公司 |
代理机构 | 天津市鼎和专利商标代理有限公司 | 代理人 | 蒙建军 |
地址 | 100089北京市海淀区长春桥路11号3号楼6层602-4 | ||
法律状态 | - |
摘要
摘要 | 本发明公开了一种基于深度学习优化网络的图文识别方法及系统,属于光学字符识别技术领域,其特征在于:至少包括如下步骤:步骤一:通过深度学习目标检测技术,识别出单帧图像中的物体;步骤二:通过抠图模型和对齐模型,将所述物体抠出图片,并对齐;步骤三:将所述图片整块进行OCR识别;步骤四:将OCR识别得到的文字识别结果送入基于深度学习自然语言处理建立的NLP校正模型进行校正,最终输出文字识别结果。本发明借助深度学习目标检测技术,通过建立不精确文本校正模型,能快速识别整块文字的照片、视频加工工艺,它能将整幅照片或整帧视频中的整块文字块标记出来,从而节省OCR处理的系统资源,大大提高文字识别效率。 |
