一种文本版面分析方法、装置、设备和介质

基本信息

申请号 CN202010635621.2 申请日 -
公开(公告)号 CN111914654A 公开(公告)日 2020-11-10
申请公布号 CN111914654A 申请公布日 2020-11-10
分类号 G06K9/00(2006.01)I 分类 计算;推算;计数;
发明人 王波;张百灵;周炬;朱华柏 申请(专利权)人 苏州开心盒子软件有限公司
代理机构 北京品源专利代理有限公司 代理人 苏州开心盒子软件有限公司
地址 215123江苏省苏州市苏州工业园区星湖街328号创意产业园6-604单元
法律状态 -

摘要

摘要 本发明实施例公开了一种文本版面分析方法、装置、介质及电子设备,其中,该方法包括:获取待分析的文本图像,对所述文本图像进行预处理;将所述文本图像输入语义分割算法模型进行版面分析,以确定所述文本图像中的版面元素;其中,所述语义分割算法模型包含编码阶段和解码阶段;所述编码阶段,用于将残差网络模型中不同阶段的高语义特征与高分辨率网络分支中的高分辨率语义特征以元素相加的方式进行特征融合;所述解码器阶段,用于将所述编码阶段最后一个阶段提取的高语义特征上采样后与所述编码阶段最后一个特征融合单元输出的高分辨率语义特征以拼接的方式进行特征融合,以确定所述文本图像中的版面元素。本发明实施例提高了版面分析的识别效果。