生物医学知识图谱实体清洗装置、方法、系统及存储器
基本信息
申请号 | CN202010503856.6 | 申请日 | - |
公开(公告)号 | CN111753096A | 公开(公告)日 | 2020-10-09 |
申请公布号 | CN111753096A | 申请公布日 | 2020-10-09 |
分类号 | G06F16/36(2019.01)I | 分类 | 计算;推算;计数; |
发明人 | 郑双佳;牛张明;张继贤 | 申请(专利权)人 | 杭州德睿智药科技有限公司 |
代理机构 | 上海智晟知识产权代理事务所(特殊普通合伙) | 代理人 | 牛张明;韦德·门佩斯-史密斯 |
地址 | 浙江省杭州市钱塘新区新加坡科技园15幢11楼 | ||
法律状态 | - |
摘要
摘要 | 本发明公开了一种生物医学知识图谱实体清洗方法,包括:从多个知识库中获取疾病名称和同义词,并获取药物副作用词表和蛋白酶词表;统一疾病词表、药物副作用词表、基因词表和蛋白酶词表的同义词字符格式;将具有相同同义词的实体合并成一组同义词,并为其确定一个统一名称;对统一名称后的实体进行统一字符格式操作;以及将统一字符格式后的实体进行同义词替换。 |
