一种OCR快速识别方法、装置、设备和介质

基本信息

申请号 CN202110209228.1 申请日 -
公开(公告)号 CN112990278A 公开(公告)日 2021-06-18
申请公布号 CN112990278A 申请公布日 2021-06-18
分类号 G06K9/62;G06N3/04 分类 计算;推算;计数;
发明人 黄家昌;管发乾;杨辉;邱道椿 申请(专利权)人 福建亿能达信息技术股份有限公司
代理机构 福州市鼓楼区京华专利事务所(普通合伙) 代理人 林燕
地址 350000 福建省福州市鼓楼区软件大道89号福州软件园A区28号楼二层
法律状态 -

摘要

摘要 本发明提供一种OCR快速识别方法、装置、设备和介质,方法包括:S1、对输入的图像进行预处理;S2、提取预处理后图像的空间潜层信息和时序潜层信息;所述空间潜层信息由空间模型通过卷积、池化、激活函数提取而得,空间模型的增加通道卷积层采用1×1卷积核来增加中间向量的通道数;所述时序潜层信息通过时序模型的多层双向SRN层提取而得,双向SRN层对大部分运算进行并行处理;S3、根据所述空间潜层信息和所述时序潜层信息,由嵌入层通过CTC进行多字符的分类,从而识别出图像上的所有字符。本发明空间模型采用1*1的卷积核来增加中间向量通道,进而降低计算量,同时将时序模型改为SRN来提取数据的时序信息,大大提高了模型的处理和识别速度,从而能实现实时识别。