组织机构信息的抽取方法、装置、存储介质及电子设备
基本信息
申请号 | CN202110485512.1 | 申请日 | - |
公开(公告)号 | CN113239144A | 公开(公告)日 | 2021-08-10 |
申请公布号 | CN113239144A | 申请公布日 | 2021-08-10 |
分类号 | G06F16/33(2019.01)I;G06F40/295(2020.01)I;G06K9/62(2006.01)I | 分类 | 计算;推算;计数; |
发明人 | 喻银根 | 申请(专利权)人 | 天九共享网络科技集团有限公司 |
代理机构 | 北京英创嘉友知识产权代理事务所(普通合伙) | 代理人 | 曾尧 |
地址 | 100012北京市朝阳区安立路30号仰山公园8号楼 | ||
法律状态 | - |
摘要
摘要 | 本公开涉及一种组织机构信息的抽取方法、装置、存储介质及电子设备,以解决样本不足导致模型抽取的准确率和召回率低的问题,该方法包括:将文本数据输入到深度学习模型,得到所述深度学习模型输出的第一抽取结果,并判断所述第一抽取结果是否属于所述组织机构信息;将所述文本数据输入到远程监督知识库,得到所述远程监督知识库输出的第二抽取结果,并判断所述第二抽取结果是否属于所述组织机构信息;在所述第一抽取结果属于所述组织机构信息的情况下,将所述第一抽取结果添加进所述远程监督知识库;在所述第二抽取结果属于所述组织机构信息的情况下,将所述文本数据和所述第二抽取结果作为所述深度学习模型的标注样本。 |
