图片文字识别模型训练方法、装置及文字识别系统
基本信息
申请号 | CN201910437650.5 | 申请日 | - |
公开(公告)号 | CN110210542B | 公开(公告)日 | 2021-10-08 |
申请公布号 | CN110210542B | 申请公布日 | 2021-10-08 |
分类号 | G06K9/62(2006.01)I;G06N3/04(2006.01)I;G06N3/08(2006.01)I | 分类 | 计算;推算;计数; |
发明人 | 陈方毅;白明白 | 申请(专利权)人 | 厦门美柚股份有限公司 |
代理机构 | 广州嘉权专利商标事务所有限公司 | 代理人 | 景鹏 |
地址 | 361000福建省厦门市厦门火炬高新区软件园华讯楼A区1F-D1 | ||
法律状态 | - |
摘要
摘要 | 本发明公开了图片文字识别模型训练方法、装置及文字识别系统。训练方法包括:S1、获取原始图片,从文本库中随机选择词语以生成测试文字;S2、随机结合测试文字和原始图片以形成测试图集;S3、训练CTPN模型以形成文字定位模型,训练CRNN模型以形成文字识别模型;S4、依次结合文字定位模型、文字识别模型以形成图片文字识别模型。本发明克服了现有文字识别算法针对于特定种类的图片中的文字识别正确率不高的问题,有效提高了特定种类的图片中的文字识别的准确率,从而为后续的违规文字或图片的处理提供识别的基础。 |
