一种随机版式票据图像合成的基础数据集构建方法

基本信息

申请号 CN202210371837.1 申请日 -
公开(公告)号 CN114722785A 公开(公告)日 2022-07-08
申请公布号 CN114722785A 申请公布日 2022-07-08
分类号 G06F40/177(2020.01)I;G06F40/174(2020.01)I;G06F40/183(2020.01)I 分类 计算;推算;计数;
发明人 朱红;寇俊霞;李果;牛浩然 申请(专利权)人 中国矿业大学(北京)
代理机构 北京华仁联合知识产权代理有限公司 代理人 -
地址 100083北京市海淀区学院路丁11号
法律状态 -

摘要

摘要 本发明公开了一种随机版式票据图像合成的基础数据集构建方法,包括票据表格线绘制、划定票据项目文本信息所在区域、填充票据项目文本信息到确定区域等3个部分,基于常见票据特征和票据版面文本关系最终得以实现。票据表格线绘制部分用于生成版式布局随机的票据表格。划定票据项目文本信息所在区域用于在票据凭证中选取位置分布随机、映射关系各样的票据项目文本信息区域。填充票据文本信息到确定区域用于生成票据相似文本并将其填充到确定好的区域,最终合成了随机版式票据图像。利用本发明方法合成的票据样本版式布局多样、布局分布合理、票据文本多样,能有效提升文本定位网络模型的准确率。