一种文字识别方法、系统、训练方法、存储介质及设备

基本信息

申请号 2020110972698 申请日 -
公开(公告)号 CN112257426A 公开(公告)日 2021-01-22
申请公布号 CN112257426A 申请公布日 2021-01-22
分类号 G06F40/279(2020.01)I; 分类 计算;推算;计数;
发明人 姬晴晴;刘家俊;刘占亮;陈鸣;陈洋 申请(专利权)人 北京一览群智数据科技有限责任公司
代理机构 北京国科程知识产权代理事务所(普通合伙) 代理人 曹晓斐
地址 100080北京市海淀区丹棱街1号院1号楼11层1102室
法律状态 -

摘要

摘要 本申请公开了一种文字识别方法、系统、训练方法、存储介质及设备,属于文字识别技术领域。该文字识别方法包括:对包含文字的文件进行改进的CRNN模型运算,得到文字的视觉特征和视觉特征对应的第一字符结果;通过语言模型对第一字符结果进行语义分析,得到文字的语义特征和语义特征对应的第二字符结果;将视觉特征和语义特征进行融合,得到文字对应的融合特征;以及对融合特征进行分类器处理,得到文字的识别结果。本申请通过视觉提取和语言模型的结合,提高文字识别的准确率。