文档文字的提取方法及提取装置

基本信息

申请号 CN201710531861.6 申请日 -
公开(公告)号 CN107358184A 公开(公告)日 2017-11-17
申请公布号 CN107358184A 申请公布日 2017-11-17
分类号 G06K9/00(2006.01)I;G06K9/38(2006.01)I 分类 计算;推算;计数;
发明人 王彦情;崔晓光;张吉祥 申请(专利权)人 天津图智科技有限公司
代理机构 中科专利商标代理有限责任公司 代理人 任岩
地址 100190 北京市海淀区中关村东路95号
法律状态 -

摘要

摘要 本发明提供了一种文档文字的提取方法,包括步骤:从包含文档文字区域和图案的图像中,提取与图案所包含的颜色相同的同色区域;对所述图像进行灰度处理,获取其前景区域,所述前景区域包括文档文字区域和图案;从前景区域中提取该图案的轮廓形状,且位于所述轮廓形状内的文字文档部分的颜色与图案所包含的颜色不同;融合所述轮廓形状和同色区域,得到公共区域,去除前景区域中的公共区域,得到仅含文档文字的图像。本发明还提供了一种文档文字的提取装置,采用计算机视觉与图像处理技术,适用于扫描图像,也适用于成像设备获取的图像,还可用于电子公文图像,其应用范围广泛,具有普适性。