一种基于国产CPU和操作系统的电子公文识别方法
基本信息
申请号 | CN202111291996.2 | 申请日 | - |
公开(公告)号 | CN114140808A | 公开(公告)日 | 2022-03-04 |
申请公布号 | CN114140808A | 申请公布日 | 2022-03-04 |
分类号 | G06V30/414(2022.01)I;G06V30/416(2022.01)I;G06V30/42(2022.01)I;G06V30/148(2022.01)I;G06V30/19(2022.01)I;G06V10/94(2022.01)I;G06N3/04(2006.01)I;G06N3/08(2006.01)I;G06K9/62(2022.01)I | 分类 | 计算;推算;计数; |
发明人 | 李利民;李杨 | 申请(专利权)人 | 浪潮软件集团有限公司 |
代理机构 | 济南信达专利事务所有限公司 | 代理人 | 郗艳荣 |
地址 | 250100山东省济南市高新区科航路2877号 | ||
法律状态 | - |
摘要
摘要 | 本发明特别涉及一种基于国产CPU和操作系统的电子公文识别方法。该基于国产CPU和操作系统的电子公文识别方法,将图片灰度化得到灰度图;对灰度图进行归一化处理得到初步分割的公文区域数据;建立CTPN神经网络模型,对公文区域进行预测得到切割好的公文区域数据集,输入CRNN+CTC神经网络得到初始公文信息,经卷积和池化,提取特征得到特征图,预测特征图标签分布和最终的标签序列,得到最终预测的公文信息。该基于国产CPU和操作系统的电子公文识别方法,能够在全国产软硬件环境下,自动识别读取纸质公文的正文内容,并转录为电子公文,提高了国产环境下电子公文系统的办公效率,进一步保障了信息安全,同时还能兼容不同国产操作系统和浏览器,适宜推广应用。 |
