多平台相似医疗数据去除方法、装置及设备

基本信息

申请号 CN202110248486.0 申请日 -
公开(公告)号 CN112863626A 公开(公告)日 2021-05-28
申请公布号 CN112863626A 申请公布日 2021-05-28
分类号 G16H10/60(2018.01)I;G16H50/70(2018.01)I 分类 物理
发明人 杨开轶;包培文;侯文利 申请(专利权)人 北京冠新医卫软件科技有限公司
代理机构 北京细软智谷知识产权代理有限责任公司 代理人 付登云
地址 100089北京市海淀区西小口路66号8幢二层201D室
法律状态 -

摘要

摘要 本发明涉及一种多平台相似医疗数据去除方法、装置及设备,属于数据过滤技术领域,方法包括通过多个目标医疗平台获取患者基础信息,并建立所述患者基础信息的患者主索引;通过所述患者主索引,定位单一患者的诊断信息;根据马氏距离计算所述诊断信息之间的相似度;判断所述相似度与相似阈值的大小,获取相似度高于所述相似阈值的患者基础信息。本发明通过扩展患者主索引建立方式以及通过内容相似性算法,对医院内部多平台进行互联互通时产生的大量相似医疗数据进行有效判定,根据业务需要进行清除或修改,保证数据分析的准确性,以解决现有技术中重复数据清洗方法存在数据清洗不彻底、依然存在很多重复数据的技术问题。