一种化学信息抽取方法、装置、设备及存储介质
基本信息
申请号 | CN202110145267.X | 申请日 | - |
公开(公告)号 | CN112818645A | 公开(公告)日 | 2021-05-18 |
申请公布号 | CN112818645A | 申请公布日 | 2021-05-18 |
分类号 | G06F40/166;G06F40/169;G06F40/279;G06F40/284;G06K9/00;G06N3/04;G06N3/08;G06F16/31 | 分类 | 计算;推算;计数; |
发明人 | 钟实;张睿哲;宋悦飞;潘志锋 | 申请(专利权)人 | 广州楹鼎生物科技有限公司 |
代理机构 | 北京品源专利代理有限公司 | 代理人 | 孟金喆 |
地址 | 510610 广东省广州市天河区林和西路3-15号22层02房 | ||
法律状态 | - |
摘要
摘要 | 本发明公开了一种化学信息抽取方法、装置、设备及存储介质。方法包括:获取化工文档,从化工文档中分离出图像和文本,从图像中提取出化学结构和用于标注化学结构的标签,建立化学结构与标签的映射关系,得到第一存储信息,从文本中提取出化学实体以及化学实体间的关联关系,得到第二存储信息,将第一存储信息和第二存储信息存储到化学数据库中。可以自动对化工文档进行扫描,从非结构化或半结构化的数据中提取出结构化的数据,便于数据管理,对化工行业的科研、生产、实验提供巨大的帮助。此外,由于无需人工手动,节省了人力成本,同时降低了输入错误,提高了数据更新速度。 |
