一种用于端到端的文字检测与识别的方法和装置
基本信息
申请号 | CN202010006312.9 | 申请日 | - |
公开(公告)号 | CN111242129A | 公开(公告)日 | 2020-06-05 |
申请公布号 | CN111242129A | 申请公布日 | 2020-06-05 |
分类号 | G06K9/34(2006.01)I;G06N3/04(2006.01)I | 分类 | 计算;推算;计数; |
发明人 | 连庆;宋彦;王咏刚 | 申请(专利权)人 | 创新工场(广州)人工智能研究有限公司 |
代理机构 | 北京启坤知识产权代理有限公司 | 代理人 | 姜冰莹 |
地址 | 510700广东省广州市黄埔区光谱中路23号A2栋1001房 | ||
法律状态 | - |
摘要
摘要 | 本申请提供了一种用于端到端的文字检测与识别的方法和装置,所述方法包括:将目标图片输入至特征提取网络,获得所述目标图片对应的共享特征信息;将所述共享特征信息输入至文字检测网络,并获得所述文字检测网络输出的字符检测结果,其中,所述字符检测结果包括字符区域检测结果和字符连接区域检测结果;将所述共享特征信息和所述字符检测结果输入至文字识别网络,获得所述文字识别网络输出的文字识别结果;根据所述字符检测结果和所述文字识别结果生成最终识别结果。根据本申请的方案,能够解决现有注意力网络可能存在的预测区域与实际区域未对准的问题,且能够更好的将文字检测系统与文字识别系统相融合。 |
