一种化验报告单自动识别方法

基本信息

申请号 CN202010567397.8 申请日 -
公开(公告)号 CN111797729A 公开(公告)日 2020-10-20
申请公布号 CN111797729A 申请公布日 2020-10-20
分类号 G06K9/00(2006.01)I 分类 计算;推算;计数;
发明人 霍红建;孟凡强;陈阶 申请(专利权)人 翰博瑞强(上海)医药科技有限公司
代理机构 贵州贵达律师事务所 代理人 张佳佳
地址 201424上海市奉贤区沪杭公路1588号3号楼1309室
法律状态 -

摘要

摘要 本发明公开了一种化验报告单自动识别方法,涉及文本识别技术领域。方法步骤为:先获取受试者的化验报告单;然后将化验报告单扫描为PDF或图片格式的标准文本,并遮盖受试者个人信息;接着基于标准文本中文字及图形分布特征建立模板模型,利用模板模型调整标准文本的待识别区域;再利用OCR技术识别待识别区域中的数据;最后对标准文本命名并根据标准文本名称将其存入对应的文件夹中。本方法根据化验报告单的特征,对不同化验报告单建立相应的模板模型,利用模板模型调整OCR识别区域以准确识别每一项不同格式的化验报告单数据,对化验报告单的识别准确率高,也提高了化验报告单数据的收集效率,解决了直接通过OCR技术进行数据采集的识别准确率低的问题。