一种基于国产CPU和操作系统的电子公文识别方法

基本信息

申请号 CN202111291996.2 申请日 -
公开(公告)号 CN114140808A 公开(公告)日 2022-03-04
申请公布号 CN114140808A 申请公布日 2022-03-04
分类号 G06V30/414(2022.01)I;G06V30/416(2022.01)I;G06V30/42(2022.01)I;G06V30/148(2022.01)I;G06V30/19(2022.01)I;G06V10/94(2022.01)I;G06N3/04(2006.01)I;G06N3/08(2006.01)I;G06K9/62(2022.01)I 分类 计算;推算;计数;
发明人 李利民;李杨 申请(专利权)人 浪潮软件集团有限公司
代理机构 济南信达专利事务所有限公司 代理人 郗艳荣
地址 250100山东省济南市高新区科航路2877号
法律状态 -

摘要

摘要 本发明特别涉及一种基于国产CPU和操作系统的电子公文识别方法。该基于国产CPU和操作系统的电子公文识别方法,将图片灰度化得到灰度图;对灰度图进行归一化处理得到初步分割的公文区域数据;建立CTPN神经网络模型,对公文区域进行预测得到切割好的公文区域数据集,输入CRNN+CTC神经网络得到初始公文信息,经卷积和池化,提取特征得到特征图,预测特征图标签分布和最终的标签序列,得到最终预测的公文信息。该基于国产CPU和操作系统的电子公文识别方法,能够在全国产软硬件环境下,自动识别读取纸质公文的正文内容,并转录为电子公文,提高了国产环境下电子公文系统的办公效率,进一步保障了信息安全,同时还能兼容不同国产操作系统和浏览器,适宜推广应用。