一种医疗数据查重和关联的方法及系统
基本信息
申请号 | CN201710153199.5 | 申请日 | - |
公开(公告)号 | CN106934038A | 公开(公告)日 | 2017-07-07 |
申请公布号 | CN106934038A | 申请公布日 | 2017-07-07 |
分类号 | G06F17/30;G06F19/00 | 分类 | 计算;推算;计数; |
发明人 | 刘劲松;王友柱;饶江;李广东;李楠;王东;陈桂太 | 申请(专利权)人 | 江苏华生基因数据科技股份有限公司 |
代理机构 | 北京精金石专利代理事务所(普通合伙) | 代理人 | 江苏华生基因数据科技股份有限公司 |
地址 | 224007 江苏省盐城市经济技术开发区希望大道南路5号4幢1401室 | ||
法律状态 | - |
摘要
摘要 | 本发明涉及一种医疗数据查重和关联的处理方法及系统,所述方法包括(1)提取待处理的医疗数据中的核心数据项;(2)将核心数据项分类;(3)分别对排除数组及模糊数组中的各个数据项初步筛查;(4)对核心数据项中的各项数据项进行深度筛查;(5)设定疑似重复数据相似度的阈值M2和/或疑似关联数据的阈值M3;(6)人工核查疑似重复和/或关联数据并给予判断后,将被判断为不重复的数据输入医疗数据库中,并给予判断为存在关联的数据一个或多个相应的关联标签。本发明与现有技术相比具有漏判率低、错判率低、查重效率高的特点,对人工核查的人工专业度要求不高,因此查重和关联的运行成本显著降低。 |
