一种文本识别方法及系统

基本信息

申请号 CN202110463484.3 申请日 -
公开(公告)号 CN112862024B 公开(公告)日 2021-09-21
申请公布号 CN112862024B 申请公布日 2021-09-21
分类号 G06K9/62(2006.01)I;G06F40/30(2020.01)I;G06N3/04(2006.01)I;G06N3/08(2006.01)I 分类 计算;推算;计数;
发明人 姚娟娟;钟南山 申请(专利权)人 明品云(北京)数据科技有限公司
代理机构 上海汉之律师事务所 代理人 马婷婷
地址 102400北京市房山区长阳万兴路86号-N3557
法律状态 -

摘要

摘要 本发明提供一种文本识别方法及系统,文本识别方法包括:采集图像样本集,图像样本集包括:数据来源标签;根据数据来源标签,将图像样本集输入文本识别网络进行训练,获取文本识别模型,文本识别模型包括:手写字体识别模型和印刷字体识别模型;获取待识别图像;将待识别图像输入文本识别模型进行文本识别,获取文本识别结果;将文本识别结果输入语义标签提取模型进行语义标签提取,获取文本识别结果中的文本向量的语义标签;根据语义标签,对文本识别结果进行更新,完成文本识别;本发明中的方法,通过获取手写字体识别模型和印刷字体识别模型,能够对待识别图像进行较准确地识别,通过提取语义标签,对文本识别结果进行更新,提高识别精确度。