一种药物实验文档的内容分析提取方法、系统和存储介质
基本信息
申请号 | CN202111481771.3 | 申请日 | - |
公开(公告)号 | CN114186543A | 公开(公告)日 | 2022-03-15 |
申请公布号 | CN114186543A | 申请公布日 | 2022-03-15 |
分类号 | G06F40/18(2020.01)I;G06F40/242(2020.01)I;G06F40/174(2020.01)I;G06V30/413(2022.01)I;G06F16/33(2019.01)I | 分类 | 计算;推算;计数; |
发明人 | 魏巍;包卿;蔡世铭 | 申请(专利权)人 | 明度智云(浙江)科技有限公司 |
代理机构 | 杭州合谱慧知识产权代理事务所(特殊普通合伙) | 代理人 | 张刚 |
地址 | 310000浙江省杭州市滨江区长河街道江虹南路316号3号楼17层1701室 | ||
法律状态 | - |
摘要
摘要 | 本发明公开了一种药物实验文档的内容分析提取方法、系统和存储介质,该方法包括获取对应药物实验文档的第一文本,通过关键词各单元格内容进行检索匹配,若匹配到关键词则查询该关键词所属的数据格式;否则调取近似字典表进行匹配,对匹配到的近似词获取对应关键词所属的数据格式;根据数据格式以该关键词或近似词所在单元格为起点,查询位于同一列或行的各单元格中数据格式,获取具有与关键词所属的数据格式相同的单元格的分布区域;最后根据分布区域获取表格类型和各关键词对应的所属数据值。实现可对药物实验文档中各种类型表格的指定类目或关键词下的数据进行分析提取,用于后续重新整理归纳成新的记录表格。 |
