一种医疗单证结构化知识提取的文本检测与识别方法
基本信息
申请号 | CN202010512139.X | 申请日 | - |
公开(公告)号 | CN111652162A | 公开(公告)日 | 2020-09-11 |
申请公布号 | CN111652162A | 申请公布日 | 2020-09-11 |
分类号 | G06K9/00(2006.01)I | 分类 | 计算;推算;计数; |
发明人 | 向飞;王一哲;罗璟诣;向宇;王刚;唐书毅;黄驰;曾欢 | 申请(专利权)人 | 成都知识视觉科技有限公司 |
代理机构 | 成都聚蓉众享知识产权代理有限公司 | 代理人 | 成都知识视觉科技有限公司 |
地址 | 610000四川省成都市金牛高新技术产业园区金科东路50号4号楼201号 | ||
法律状态 | - |
摘要
摘要 | 本发明公开了一种医疗单证结构化知识提取的文本检测与识别方法,属于医疗单证信息提取技术领域,目的在于解决现有医疗单证信息处理效率低、智能化程度低的问题。其包括以下步骤:(1)图像识别:对医疗单证图像进行OCR识别;(2)模板匹配:将识别的图像匹配对应模板;(3)文本检测:通过文本检测获取文本在图中的位置信息;(4)错位调整:利用文本间的空间和语义关系,将错位文字调整正确;(5)文本识别:通过OCR识别文本,转换成文本数据;(6)结果校验:基于规则引擎、垂直领域知识图谱、值域统计对识别结果进行校验;(7)结构化输出:将识别校验后的文本内容结构化,输出为可编辑的数据。本发明适用于医疗单证文本检测与识别。 |
