一种基于深度学习优化网络的图文识别方法及系统

基本信息

申请号 CN202011178476.6 申请日 -
公开(公告)号 CN112348024A 公开(公告)日 2021-02-09
申请公布号 CN112348024A 申请公布日 2021-02-09
分类号 G06K9/34(2006.01)I; 分类 计算;推算;计数;
发明人 戴亦斌 申请(专利权)人 北京信工博特智能科技有限公司
代理机构 天津市鼎和专利商标代理有限公司 代理人 蒙建军
地址 100089北京市海淀区长春桥路11号3号楼6层602-4
法律状态 -

摘要

摘要 本发明公开了一种基于深度学习优化网络的图文识别方法及系统,属于光学字符识别技术领域,其特征在于:至少包括如下步骤:步骤一:通过深度学习目标检测技术,识别出单帧图像中的物体;步骤二:通过抠图模型和对齐模型,将所述物体抠出图片,并对齐;步骤三:将所述图片整块进行OCR识别;步骤四:将OCR识别得到的文字识别结果送入基于深度学习自然语言处理建立的NLP校正模型进行校正,最终输出文字识别结果。本发明借助深度学习目标检测技术,通过建立不精确文本校正模型,能快速识别整块文字的照片、视频加工工艺,它能将整幅照片或整帧视频中的整块文字块标记出来,从而节省OCR处理的系统资源,大大提高文字识别效率。