一种多规格文本协同定位和提取方法

基本信息

申请号 CN201711360636.7 申请日 -
公开(公告)号 CN108875721A 公开(公告)日 2018-11-23
申请公布号 CN108875721A 申请公布日 2018-11-23
分类号 G06K9/20;G06K9/00 分类 计算;推算;计数;
发明人 严京旗;张成栋;李进文;罗宝娟 申请(专利权)人 南通艾思达智能科技有限公司
代理机构 - 代理人 -
地址 226299 江苏省南通市开发区海德路2号1幢110490室
法律状态 -

摘要

摘要 本发明涉及一种多规格文本协同定位和提取方法,包括如下步骤:步骤110获取文本图像数据;步骤120、图像归一化操作;步骤130、分离图像背景信息和需要采集的前景信息;步骤140、全局协同搜索,提取出预设格式的各个文本块区域;步骤150、局部优化搜索,在小范围内逐个优化各个文本区域的位置;步骤160输出各个文本块定位结果,提供给后续单字切分和识别模块。本发明利用图像处理、目标检测、协同搜索、局部优化等技术,满足格式化数据采集的要求,克服某些文本块退化后的漏检和错检问题并最大程度避免不必要的文本和噪声信息的干扰,提高格式化文本信息采集的准度和精度。