一种化验报告单自动识别方法
基本信息
申请号 | CN202010567397.8 | 申请日 | - |
公开(公告)号 | CN111797729A | 公开(公告)日 | 2020-10-20 |
申请公布号 | CN111797729A | 申请公布日 | 2020-10-20 |
分类号 | G06K9/00(2006.01)I | 分类 | 计算;推算;计数; |
发明人 | 霍红建;孟凡强;陈阶 | 申请(专利权)人 | 翰博瑞强(上海)医药科技有限公司 |
代理机构 | 贵州贵达律师事务所 | 代理人 | 张佳佳 |
地址 | 201424上海市奉贤区沪杭公路1588号3号楼1309室 | ||
法律状态 | - |
摘要
摘要 | 本发明公开了一种化验报告单自动识别方法,涉及文本识别技术领域。方法步骤为:先获取受试者的化验报告单;然后将化验报告单扫描为PDF或图片格式的标准文本,并遮盖受试者个人信息;接着基于标准文本中文字及图形分布特征建立模板模型,利用模板模型调整标准文本的待识别区域;再利用OCR技术识别待识别区域中的数据;最后对标准文本命名并根据标准文本名称将其存入对应的文件夹中。本方法根据化验报告单的特征,对不同化验报告单建立相应的模板模型,利用模板模型调整OCR识别区域以准确识别每一项不同格式的化验报告单数据,对化验报告单的识别准确率高,也提高了化验报告单数据的收集效率,解决了直接通过OCR技术进行数据采集的识别准确率低的问题。 |
