电子病历的文本数据解析方法和装置

基本信息

申请号 CN201810430349.7 申请日 -
公开(公告)号 CN108711443A 公开(公告)日 2018-10-26
申请公布号 CN108711443A 申请公布日 2018-10-26
分类号 G16H10/60;G06F17/30 分类 物理
发明人 陈曦 申请(专利权)人 成都智信电子技术有限公司
代理机构 北京细软智谷知识产权代理有限责任公司 代理人 成都智信电子技术有限公司
地址 610051 四川省成都市成华区猛追湾街339写字楼B座705室
法律状态 -

摘要

摘要 本申请涉及一种电子病历的文本数据解析方法和装置,所述方法包括:对样本文件进行处理,获取样本文件中的所有文本信息;根据获取的文本信息和样本文件的标签结构,建立知识框架字典;获取待解析的电子病历,提取出其中的原始文本信息;将原始文本信息与所述知识框架字典中的内容进行对比判断,完成原始文本信息的结构化解析。本申请能够在XML文件存在大量标签,或标签设计和内容填写混乱的情况下,以简洁的方法抽取文本内容;抛弃了现有的文本解析方法对XML标签的依赖,大大减少了代码量;并结合知识框架字典,保证了结构解析的正确性。