一种表格识别方法、装置、设备及可读存储介质

基本信息

申请号 CN202011232039.8 申请日 -
公开(公告)号 CN112329641A 公开(公告)日 2021-02-05
申请公布号 CN112329641A 申请公布日 2021-02-05
分类号 G06K9/00(2006.01)I; 分类 计算;推算;计数;
发明人 顾佳烽;刘余海;原新新 申请(专利权)人 上海恒生聚源数据服务有限公司
代理机构 北京集佳知识产权代理有限公司 代理人 刘颖
地址 200127上海市浦东新区峨山路91弄61号7楼
法律状态 -

摘要

摘要 本申请实施例提供了一种表格识别方法、装置、设备及可读存储介质,获取待识别图像,确定待识别图像中的分词块,分词块的第一类坐标值包括分词块的上边界在竖直方向的坐标值和分词块的下边界在竖直方向的坐标值,分词块的第二类坐标值包括分词块的左边界在水平方向的坐标值和分词块的右边界在水平方向的坐标值,任意一个分词块的第一类坐标值能够表征该分词块在待识别图像中在竖直方向的位置,任意一个分词块的第二类坐标值能够表征该分词块在待识别图像中在水平方向的位置。因此,本方案依据分词块的第一类坐标值确定目标行的上边界线以及下边界线。依据分词块的第二类坐标值以及目标行的边界线,确定目标列左边界线和右边界线。