生物医学知识图谱实体清洗装置、方法、系统及存储器

基本信息

申请号 CN202010503856.6 申请日 -
公开(公告)号 CN111753096A 公开(公告)日 2020-10-09
申请公布号 CN111753096A 申请公布日 2020-10-09
分类号 G06F16/36(2019.01)I 分类 计算;推算;计数;
发明人 郑双佳;牛张明;张继贤 申请(专利权)人 杭州德睿智药科技有限公司
代理机构 上海智晟知识产权代理事务所(特殊普通合伙) 代理人 牛张明;韦德·门佩斯-史密斯
地址 浙江省杭州市钱塘新区新加坡科技园15幢11楼
法律状态 -

摘要

摘要 本发明公开了一种生物医学知识图谱实体清洗方法,包括:从多个知识库中获取疾病名称和同义词,并获取药物副作用词表和蛋白酶词表;统一疾病词表、药物副作用词表、基因词表和蛋白酶词表的同义词字符格式;将具有相同同义词的实体合并成一组同义词,并为其确定一个统一名称;对统一名称后的实体进行统一字符格式操作;以及将统一字符格式后的实体进行同义词替换。