一种文本识别方法及系统
基本信息
申请号 | CN202110463484.3 | 申请日 | - |
公开(公告)号 | CN112862024B | 公开(公告)日 | 2021-09-21 |
申请公布号 | CN112862024B | 申请公布日 | 2021-09-21 |
分类号 | G06K9/62(2006.01)I;G06F40/30(2020.01)I;G06N3/04(2006.01)I;G06N3/08(2006.01)I | 分类 | 计算;推算;计数; |
发明人 | 姚娟娟;钟南山 | 申请(专利权)人 | 明品云(北京)数据科技有限公司 |
代理机构 | 上海汉之律师事务所 | 代理人 | 马婷婷 |
地址 | 102400北京市房山区长阳万兴路86号-N3557 | ||
法律状态 | - |
摘要
摘要 | 本发明提供一种文本识别方法及系统,文本识别方法包括:采集图像样本集,图像样本集包括:数据来源标签;根据数据来源标签,将图像样本集输入文本识别网络进行训练,获取文本识别模型,文本识别模型包括:手写字体识别模型和印刷字体识别模型;获取待识别图像;将待识别图像输入文本识别模型进行文本识别,获取文本识别结果;将文本识别结果输入语义标签提取模型进行语义标签提取,获取文本识别结果中的文本向量的语义标签;根据语义标签,对文本识别结果进行更新,完成文本识别;本发明中的方法,通过获取手写字体识别模型和印刷字体识别模型,能够对待识别图像进行较准确地识别,通过提取语义标签,对文本识别结果进行更新,提高识别精确度。 |
