一种证件图像文字提取方法

基本信息

申请号 CN202011564026.0 申请日 -
公开(公告)号 CN112528954A 公开(公告)日 2021-03-19
申请公布号 CN112528954A 申请公布日 2021-03-19
分类号 G06N3/04(2006.01)I;G06K9/32(2006.01)I;G06N3/08(2006.01)I;G06K9/00(2006.01)I 分类 计算;推算;计数;
发明人 吴志雄;白丹;周兴杰;冯智辉 申请(专利权)人 深圳太极数智技术有限公司
代理机构 深圳金伟创新专利代理事务所(普通合伙) 代理人 韦永吉
地址 518000 广东省深圳市福田区梅林街道梅都社区中康路136号深圳新一代产业园3栋1402
法律状态 -

摘要

摘要 本发明公开一种证件图像文字提取方法,包括以下步骤:S1、输入证件图像;S2、通过文字检测模型检测证件图像中的文字位置,并通过标注框标注文字位置;S3、统计证件图像中标注框位置分布情况,判断图像方向并进行调整;S4、建立平面坐标,将标注框按照Y轴进行同行合并、排序,获取每行文字的信息框;S5、将标准模板与信息框对齐,输出信息框与标准模板的交集部分,裁剪输出文字图片;S6、用文字识别模型识别文字图片,提取文字内容。