一种医疗单证结构化知识提取的文本检测与识别方法

基本信息

申请号 CN202010512139.X 申请日 -
公开(公告)号 CN111652162A 公开(公告)日 2020-09-11
申请公布号 CN111652162A 申请公布日 2020-09-11
分类号 G06K9/00(2006.01)I 分类 计算;推算;计数;
发明人 向飞;王一哲;罗璟诣;向宇;王刚;唐书毅;黄驰;曾欢 申请(专利权)人 成都知识视觉科技有限公司
代理机构 成都聚蓉众享知识产权代理有限公司 代理人 成都知识视觉科技有限公司
地址 610000四川省成都市金牛高新技术产业园区金科东路50号4号楼201号
法律状态 -

摘要

摘要 本发明公开了一种医疗单证结构化知识提取的文本检测与识别方法,属于医疗单证信息提取技术领域,目的在于解决现有医疗单证信息处理效率低、智能化程度低的问题。其包括以下步骤:(1)图像识别:对医疗单证图像进行OCR识别;(2)模板匹配:将识别的图像匹配对应模板;(3)文本检测:通过文本检测获取文本在图中的位置信息;(4)错位调整:利用文本间的空间和语义关系,将错位文字调整正确;(5)文本识别:通过OCR识别文本,转换成文本数据;(6)结果校验:基于规则引擎、垂直领域知识图谱、值域统计对识别结果进行校验;(7)结构化输出:将识别校验后的文本内容结构化,输出为可编辑的数据。本发明适用于医疗单证文本检测与识别。