一种化学信息抽取方法、装置、设备及存储介质

基本信息

申请号 CN202110145267.X 申请日 -
公开(公告)号 CN112818645A 公开(公告)日 2021-05-18
申请公布号 CN112818645A 申请公布日 2021-05-18
分类号 G06F40/166;G06F40/169;G06F40/279;G06F40/284;G06K9/00;G06N3/04;G06N3/08;G06F16/31 分类 计算;推算;计数;
发明人 钟实;张睿哲;宋悦飞;潘志锋 申请(专利权)人 广州楹鼎生物科技有限公司
代理机构 北京品源专利代理有限公司 代理人 孟金喆
地址 510610 广东省广州市天河区林和西路3-15号22层02房
法律状态 -

摘要

摘要 本发明公开了一种化学信息抽取方法、装置、设备及存储介质。方法包括:获取化工文档,从化工文档中分离出图像和文本,从图像中提取出化学结构和用于标注化学结构的标签,建立化学结构与标签的映射关系,得到第一存储信息,从文本中提取出化学实体以及化学实体间的关联关系,得到第二存储信息,将第一存储信息和第二存储信息存储到化学数据库中。可以自动对化工文档进行扫描,从非结构化或半结构化的数据中提取出结构化的数据,便于数据管理,对化工行业的科研、生产、实验提供巨大的帮助。此外,由于无需人工手动,节省了人力成本,同时降低了输入错误,提高了数据更新速度。