一种基于文字识别的中文字段检测方法及系统
基本信息
申请号 | CN202010304190.1 | 申请日 | - |
公开(公告)号 | CN111507353A | 公开(公告)日 | 2020-08-07 |
申请公布号 | CN111507353A | 申请公布日 | 2020-08-07 |
分类号 | G06K9/34;G06K9/20;G06K9/62;G06N3/04;G06N3/08 | 分类 | - |
发明人 | 杨凯越 | 申请(专利权)人 | 新分享科技服务(深圳)有限公司 |
代理机构 | 北京中政联科专利代理事务所(普通合伙) | 代理人 | 新分享科技服务(深圳)有限公司 |
地址 | 518000 广东省深圳市前海深港合作区前湾一路1号A栋201室(入驻深圳市前海商务秘书有限公司) | ||
法律状态 | - |
摘要
摘要 | 一种基于文字识别的中文字段检测方法及系统,包括:识别预选区域中的文字区域,集合文字区域并计算相对距离矩阵;基于DBSCAN(基于密度的分层聚类)将矩阵聚类得到字符串区域;将字符串区域通过滑窗提取字符后放入单字符分类器,获得预测中文字段;基于预测中文字段通过CTCLoss正反向训练单字符分类器,并通过softmax函数输出字符概率;将滑窗提取的字符放入训练后的单字符分类器中得到中文字段。通过相对距离矩阵聚字成串和滑窗分类器正反向CTCLoss训练,能够精准的识别复杂环境下的中文字段。解决了字符串提取不精确以及模型时间和空间复杂度过大的问题,能较为精准的识别复杂环境下的中文字段。 |
