一种手写英文行识别系统
基本信息
申请号 | CN202210217783.3 | 申请日 | - |
公开(公告)号 | CN114299510A | 公开(公告)日 | 2022-04-08 |
申请公布号 | CN114299510A | 申请公布日 | 2022-04-08 |
分类号 | G06V30/22(2022.01)I;G06V10/40(2022.01)I;G06V10/80(2022.01)I;G06V10/82(2022.01)I;G06V30/19(2022.01)I | 分类 | 计算;推算;计数; |
发明人 | 许信顺;谭玉慧;马磊;陈义学 | 申请(专利权)人 | 山东山大鸥玛软件股份有限公司 |
代理机构 | 山东舜源联合知识产权代理有限公司 | 代理人 | 马洪磊 |
地址 | 250101山东省济南市高新区伯乐路128号 | ||
法律状态 | - |
摘要
摘要 | 本发明提出的一种手写英文行识别系统,属于文本识别技术领域。包括:视觉模块、语义模块和融合模块;视觉模块,用于使用ResNet网络提取手写英文行的文本图像的空间特征,并使用基于CTC和基于Attention的模型进行解码,输出字符级解码和单词级解码;语义模块,用于使用视觉模块中输出的基于Attention的字符级解码的输出概率作为输入,通过使用梯度截断策略,以纠正预测序列的方式显式学习英文行中潜在的语义信息;融合模块,用于通过使用门机制将视觉模块提取到的视觉信息和语义模块提取到的语义信息进行结合,以生成预测结果。 |
