一种OCR快速识别方法、装置、设备和介质
基本信息

| 申请号 | CN202110209228.1 | 申请日 | - |
| 公开(公告)号 | CN112990278A | 公开(公告)日 | 2021-06-18 |
| 申请公布号 | CN112990278A | 申请公布日 | 2021-06-18 |
| 分类号 | G06K9/62;G06N3/04 | 分类 | 计算;推算;计数; |
| 发明人 | 黄家昌;管发乾;杨辉;邱道椿 | 申请(专利权)人 | 福建亿能达信息技术股份有限公司 |
| 代理机构 | 福州市鼓楼区京华专利事务所(普通合伙) | 代理人 | 林燕 |
| 地址 | 350000 福建省福州市鼓楼区软件大道89号福州软件园A区28号楼二层 | ||
| 法律状态 | - | ||
摘要

| 摘要 | 本发明提供一种OCR快速识别方法、装置、设备和介质,方法包括:S1、对输入的图像进行预处理;S2、提取预处理后图像的空间潜层信息和时序潜层信息;所述空间潜层信息由空间模型通过卷积、池化、激活函数提取而得,空间模型的增加通道卷积层采用1×1卷积核来增加中间向量的通道数;所述时序潜层信息通过时序模型的多层双向SRN层提取而得,双向SRN层对大部分运算进行并行处理;S3、根据所述空间潜层信息和所述时序潜层信息,由嵌入层通过CTC进行多字符的分类,从而识别出图像上的所有字符。本发明空间模型采用1*1的卷积核来增加中间向量通道,进而降低计算量,同时将时序模型改为SRN来提取数据的时序信息,大大提高了模型的处理和识别速度,从而能实现实时识别。 |





