一种基于边界识别与组合的裁判文书证据抽取方法

基本信息

申请号 CN201910816186.0 申请日 -
公开(公告)号 CN110516257A 公开(公告)日 2019-11-29
申请公布号 CN110516257A 申请公布日 2019-11-29
分类号 G06F17/27;G06F16/35;G06F16/33;G06K9/62;G06N3/04;G06N3/08 分类 计算;推算;计数;
发明人 黄瑞章;杨健;丁志远;陈艳平;秦永彬 申请(专利权)人 贵州省高级人民法院
代理机构 贵阳中新专利商标事务所 代理人 李亮;程新敏
地址 550025 贵州省贵阳市花溪区贵州大学北校区科学技术处
法律状态 -

摘要

摘要 本发明公开了一种一种基于边界识别与组合的裁判文书证据抽取方法。为了有效抽取裁判文书里的证据,本发明分为三步:(1)使用RNNs识别证据实体的开始边界和结束边界。(2)组合所有开始边界和结束边界形成候选证据实体。(3)使用CNN对候选证据进行分类,识别真实的证据。基于边界识别与组合的方法弥补了传统的序列标注模型在长实体的识别上性能比较低的缺点,并且在一定程度上避免传统机器学习方法产生的特征稀疏问题,从而提高了裁判文书中证据抽取的性能。