文本识别模型的训练方法及装置、文本识别方法及装置

基本信息

申请号 CN202110431158.4 申请日 -
公开(公告)号 CN113111871A 公开(公告)日 2021-07-13
申请公布号 CN113111871A 申请公布日 2021-07-13
分类号 G06K9/20(2006.01)I;G06K9/34(2006.01)I;G06K9/62(2006.01)I;G06N3/04(2006.01)I;G06N3/08(2006.01)I 分类 计算;推算;计数;
发明人 张鹏远;李长亮;毛璐 申请(专利权)人 成都金山互动娱乐科技有限公司
代理机构 北京智信禾专利代理有限公司 代理人 吴肖肖
地址 100085北京市海淀区西二旗中路33号院5号楼11层002号
法律状态 -

摘要

摘要 本申请提供一种文本识别模型的训练方法及装置、文本识别方法及装置,其中所述文本识别模型的训练方法包括:将获取的第一样本图像输入文本识别模型的区域检测网络,确定第一样本图像的至少一个第一子样本图像;将至少一个第一子样本图像输入文本识别模型的字符识别网络,确定第一样本图像的预测文本,该预测文本基于字符识别网络提取的每个第一子样本图像中图像特征之间的序列关系确定;确定预测文本和第一样本图像的第一样本标签之间的第一误差值,该第一样本标签为第一样本图像中实际存在的文本;基于第一误差值对文本识别模型进行训练,直至达到训练停止条件。上述方法使得得到的预测文本准确率更高,可以提高文本识别模型的训练效率。