一种医疗数据查重和关联的方法及系统

基本信息

申请号 CN201710153199.5 申请日 -
公开(公告)号 CN106934038A 公开(公告)日 2017-07-07
申请公布号 CN106934038A 申请公布日 2017-07-07
分类号 G06F17/30;G06F19/00 分类 计算;推算;计数;
发明人 刘劲松;王友柱;饶江;李广东;李楠;王东;陈桂太 申请(专利权)人 江苏华生基因数据科技股份有限公司
代理机构 北京精金石专利代理事务所(普通合伙) 代理人 江苏华生基因数据科技股份有限公司
地址 224007 江苏省盐城市经济技术开发区希望大道南路5号4幢1401室
法律状态 -

摘要

摘要 本发明涉及一种医疗数据查重和关联的处理方法及系统,所述方法包括(1)提取待处理的医疗数据中的核心数据项;(2)将核心数据项分类;(3)分别对排除数组及模糊数组中的各个数据项初步筛查;(4)对核心数据项中的各项数据项进行深度筛查;(5)设定疑似重复数据相似度的阈值M2和/或疑似关联数据的阈值M3;(6)人工核查疑似重复和/或关联数据并给予判断后,将被判断为不重复的数据输入医疗数据库中,并给予判断为存在关联的数据一个或多个相应的关联标签。本发明与现有技术相比具有漏判率低、错判率低、查重效率高的特点,对人工核查的人工专业度要求不高,因此查重和关联的运行成本显著降低。