一种医疗实体关系抽取方法及装置

基本信息

申请号 CN202011560534.1 申请日 -
公开(公告)号 CN112599211A 公开(公告)日 2021-04-02
申请公布号 CN112599211A 申请公布日 2021-04-02
分类号 G06F16/33(2019.01)I;G06F40/295(2020.01)I;G16H10/60(2018.01)I;G16H50/70(2018.01)I;G06F40/216(2020.01)I;G06F16/35(2019.01)I 分类 物理
发明人 程龙龙;崔丙剑;马思远;袁丁;李铭辉 申请(专利权)人 中电云脑(天津)科技有限公司
代理机构 北京同达信恒知识产权代理有限公司 代理人 郭晓丽
地址 300000天津市东丽区东丽湖街道景湖科技园6号楼2-101-01室
法律状态 -

摘要

摘要 本申请涉及信息抽取技术领域,提供一种医疗实体关系抽取方法及装置,以解决传统Pipeline式关系抽取法计算冗余、准确率低的问题,该方法包括:基于第一医疗文本中的医疗文本特征,确定对应的至少一个医疗关系;基于第一医疗文本和至少一个医疗关系,得到至少一个第二医疗文本;将至少一个第二医疗文本输入到训练完毕的实体提取模型中,得到至少一个第二医疗文本所包含的医疗关系对应的实体对;基于至少一个医疗关系和对应的实体对,生成对应的三元组。先确定医疗关系,再确定每个医疗关系对应的实体对,这样无需冗余计算,不但节省了运算时间,也降低了运算复杂度,还提高了医疗关系识别的准确率。