一种基于文字识别的中文字段检测方法及系统

基本信息

申请号 CN202010304190.1 申请日 -
公开(公告)号 CN111507353A 公开(公告)日 2020-08-07
申请公布号 CN111507353A 申请公布日 2020-08-07
分类号 G06K9/34;G06K9/20;G06K9/62;G06N3/04;G06N3/08 分类 -
发明人 杨凯越 申请(专利权)人 新分享科技服务(深圳)有限公司
代理机构 北京中政联科专利代理事务所(普通合伙) 代理人 新分享科技服务(深圳)有限公司
地址 518000 广东省深圳市前海深港合作区前湾一路1号A栋201室(入驻深圳市前海商务秘书有限公司)
法律状态 -

摘要

摘要 一种基于文字识别的中文字段检测方法及系统,包括:识别预选区域中的文字区域,集合文字区域并计算相对距离矩阵;基于DBSCAN(基于密度的分层聚类)将矩阵聚类得到字符串区域;将字符串区域通过滑窗提取字符后放入单字符分类器,获得预测中文字段;基于预测中文字段通过CTCLoss正反向训练单字符分类器,并通过softmax函数输出字符概率;将滑窗提取的字符放入训练后的单字符分类器中得到中文字段。通过相对距离矩阵聚字成串和滑窗分类器正反向CTCLoss训练,能够精准的识别复杂环境下的中文字段。解决了字符串提取不精确以及模型时间和空间复杂度过大的问题,能较为精准的识别复杂环境下的中文字段。