自然语言文本与医学知识图谱的实体链指方法及系统

基本信息

申请号 CN202111052099.6 申请日 -
公开(公告)号 CN113821597A 公开(公告)日 2021-12-21
申请公布号 CN113821597A 申请公布日 2021-12-21
分类号 G06F16/33(2019.01)I;G06F16/36(2019.01)I;G06F40/295(2020.01)I;G06F40/30(2020.01)I 分类 计算;推算;计数;
发明人 刘鹏;王则远 申请(专利权)人 灵犀量子(北京)医疗科技有限公司
代理机构 北京路浩知识产权代理有限公司 代理人 王宇杨
地址 100161北京市丰台区南四环西路186号四区5号楼5层09室
法律状态 -

摘要

摘要 本发明提供自然语言文本与医学知识图谱的实体链指方法,包括获得与医学知识相关的自然语言文本;利用命名实体识别模型在自然语言文本上识别目标医学实体,并得到目标医学实体所属类别;从医学知识图谱中获取与目标医学实体所属类别对应的若干候选医学实体;通过相似度打分模型分别计算各候选医学实体与目标医学实体之间的相似度,并根据相似度的高低排序实现候选医学实体与目标医学实体的链指。本发明通过相似度打分模型计算候选医学实体与目标医学实体之间的相似度更加能够从语义层面描述两个实体之间的相似度,根据相似度的高低排序实现候选医学实体与目标医学实体的链指,能够进一步提高链指精度,如此所得的医学知识图谱也更利于维护。