敏感信息提取方法、裁判文书处理方法、装置和电子设备

基本信息

申请号 CN202010407794.9 申请日 -
公开(公告)号 CN111553318A 公开(公告)日 2020-08-18
申请公布号 CN111553318A 申请公布日 2020-08-18
分类号 G06K9/00(2006.01)I 分类 -
发明人 李东海;郭晓妮;侯晓焱;黄晓宏;刘亚会 申请(专利权)人 北京华宇元典信息服务有限公司
代理机构 北京唐颂永信知识产权代理有限公司 代理人 北京华宇元典信息服务有限公司
地址 100080北京市海淀区西小口路66号东升科技园北领地B2楼D301
法律状态 -

摘要

摘要 公开了一种裁判文书的敏感信息提取方法和装置,裁判文书处理方法和装置以及电子设备。该裁判文书的敏感信息提取方法包括:获取多个裁判文书样本;使用实体识别方法识别所述多个裁判文书样本适于以特征标注的敏感信息;以及,使用基于正例和未标记学习的敏感信息识别模型识别所述多个裁判文书样本的不适于以特征标注的敏感信息。这样,针对不同类型的敏感信息,采用不同类型的敏感信息提取方法进行处理,以提高敏感信息识别和提取的查全率。