一种医疗大数据的数据标准化处理方法及装置

基本信息

申请号 CN201710101827.5 申请日 -
公开(公告)号 CN106919793B 公开(公告)日 2019-12-06
申请公布号 CN106919793B 申请公布日 2019-12-06
分类号 G16H50/70(2018.01); G06F17/27(2006.01) 分类 物理
发明人 金以东; 黄玉丽; 李雪莉 申请(专利权)人 黑龙江特士信息技术有限公司
代理机构 北京三友知识产权代理有限公司 代理人 黑龙江特士信息技术有限公司;易保互联医疗信息科技(北京)有限公司
地址 150000 黑龙江省哈尔滨市经开区哈平路集中区松花路9号中国云谷软件园1号楼214室
法律状态 -

摘要

摘要 本发明提供了一种医疗大数据的数据标准化处理方法及装置,涉及医疗实体识别技术领域。方法包括:根据待处理语句的实体标记序列,确定待处理语句的第一组候选实体;根据预先设置的医学本体术语抽词策略对待处理语句进行抽词,确定第二组候选实体;从第一组候选实体和第二组候选实体中确定待处理语句中的实体;根据预先设置的句法分析筛选规则进行筛选,确定待处理语句中的候选标准化术语;在待处理语句中的候选标准化术语与预先设置的医学本体术语库匹配成功,将待处理语句中的候选标准化术语确定为标准化术语;若匹配失败,生成匹配失败问题报告或对匹配失败且术语类型为疾病类的候选标准化术语进行模糊匹配,以确定标准化术语。