电子病历的文本数据解析方法和装置
基本信息
申请号 | CN201810430349.7 | 申请日 | - |
公开(公告)号 | CN108711443A | 公开(公告)日 | 2018-10-26 |
申请公布号 | CN108711443A | 申请公布日 | 2018-10-26 |
分类号 | G16H10/60;G06F17/30 | 分类 | 物理 |
发明人 | 陈曦 | 申请(专利权)人 | 成都智信电子技术有限公司 |
代理机构 | 北京细软智谷知识产权代理有限责任公司 | 代理人 | 成都智信电子技术有限公司 |
地址 | 610051 四川省成都市成华区猛追湾街339写字楼B座705室 | ||
法律状态 | - |
摘要
摘要 | 本申请涉及一种电子病历的文本数据解析方法和装置,所述方法包括:对样本文件进行处理,获取样本文件中的所有文本信息;根据获取的文本信息和样本文件的标签结构,建立知识框架字典;获取待解析的电子病历,提取出其中的原始文本信息;将原始文本信息与所述知识框架字典中的内容进行对比判断,完成原始文本信息的结构化解析。本申请能够在XML文件存在大量标签,或标签设计和内容填写混乱的情况下,以简洁的方法抽取文本内容;抛弃了现有的文本解析方法对XML标签的依赖,大大减少了代码量;并结合知识框架字典,保证了结构解析的正确性。 |
