一种针对具有大字符间距与局部遮挡的场景文本检测方法
基本信息
申请号 | CN202011110021.0 | 申请日 | - |
公开(公告)号 | CN112215235A | 公开(公告)日 | 2021-01-12 |
申请公布号 | CN112215235A | 申请公布日 | 2021-01-12 |
分类号 | G06K9/34(2006.01)I | 分类 | 计算;推算;计数; |
发明人 | 高攀;刘磊;黄军文;汤红 | 申请(专利权)人 | 深圳华付技术股份有限公司 |
代理机构 | 深圳市中兴达专利代理有限公司 | 代理人 | 深圳市华付信息技术有限公司 |
地址 | 518000广东省深圳市前海深港合作区前湾一路1号A栋201室(入驻深圳市前海商务秘书有限公司) | ||
法律状态 | - |
摘要
摘要 | 本发明属于光学字符识别技术领域,尤其涉及一种针对具有大字符间距与局部遮挡的场景文本检测方法,包括以下步骤:S1、通过全卷积神经网络对输入的图片提取特征,并将不同层次的特征进行融合;S2、融合后的特征经过文本语义分割网络输出文本分割图,以及经过文本实例特征嵌入模块输出文本实例嵌入特征图;S3、将文本分割图与文本实例嵌入特征图通过文本实例重组算法得到文本检测结果。其中文本实例嵌入模块将每个像素嵌入特征空间,文本区域中的平均像素特征视为文本区域的特征,随后,文本实例重组算法将具有相似特征的文本候选区域进行重组,由于字符间距大或局部被遮挡而被分割为多个区域的文本实例,能够重新被检测成一个完整的对象。 |
