一种物质名称提取方法、装置及存储介质
基本信息
申请号 | CN202010892360.2 | 申请日 | - |
公开(公告)号 | CN112183076A | 公开(公告)日 | 2021-01-05 |
申请公布号 | CN112183076A | 申请公布日 | 2021-01-05 |
分类号 | G06F40/258(2020.01)I | 分类 | 计算;推算;计数; |
发明人 | 白芳;杨宇星;周杰龙 | 申请(专利权)人 | 北京望石智慧科技有限公司 |
代理机构 | 北京三聚阳光知识产权代理有限公司 | 代理人 | 北京望石智慧科技有限公司 |
地址 | 100080北京市海淀区中关村19号新中关大厦B座1708 | ||
法律状态 | - |
摘要
摘要 | 本发明提供一种物质名称提取方法、装置及存储介质,其中,方法包括如下步骤:获取待提取文本文件;确定所述待提取文本文件是否包含预设标识;当所述待提取文本文件包含所述预设标识,利用预先训练好的物质名称提取模型对所述预设标识对应的文本内容进行目标物质名称提取。通过实施本发明,根据预设标识查找预设标识对应部分的文本内容中是否含有物质名称信息,而预设标识可以预先根据需要设定,提高了物质名称提取的灵活性,并且,当预设标识为专利文本中实施例、步骤等对应的文本内容包含详细技术内容介绍之类的关键字,在提高物质名称提取的针对性的同时,不需要对整篇专利进行名称提取,从而提高物质名称提取的效率。 |
