一种基于领域自适应的文本行识别系统以及使用方法

基本信息

申请号 CN202110230034.X 申请日 -
公开(公告)号 CN112926665A 公开(公告)日 2021-06-08
申请公布号 CN112926665A 申请公布日 2021-06-08
分类号 G06K9/62;G06N3/04;G06N3/08 分类 计算;推算;计数;
发明人 闫琦;李哲;陈家海;叶家鸣;吴波 申请(专利权)人 安徽七天网络科技有限公司
代理机构 安徽申策知识产权代理事务所(普通合伙) 代理人 程艳梅
地址 230012 安徽省合肥市新站区铜陵北路与颍河路交口新站总部经济大厦B楼1201室
法律状态 -

摘要

摘要 一种基于领域自适应的文本行识别系统以及使用方法,涉及文本识别领域和迁移学习领域。针对实际的拍照场景文本行数据收集、制作困难,本发明提出基于领域自适应的文本行识别方案。该方案,主要包含数据预处理部分、编码器部分、数据域反向分类器部分以及源域数据的解码器部分。该发明仅需要提供少量的拍照文本行图像数据,就可以实现端到端的训练,并达到类似于有监督的文本识别效果。本发明设计合理,使用方便,效果良好。