一种用于裁判文书的结构化处理方法及处理装置

基本信息

申请号 CN201911333386.7 申请日 -
公开(公告)号 CN111078839A 公开(公告)日 2020-04-28
申请公布号 CN111078839A 申请公布日 2020-04-28
分类号 G06F16/33;G06F40/289;G06Q50/18 分类 计算;推算;计数;
发明人 王可佳;张树军;尹士朝;谭宁;张贵森 申请(专利权)人 广州佳都数据服务有限公司
代理机构 北京睿智保诚专利代理事务所(普通合伙) 代理人 周新楣
地址 510000 广东省广州市天河区软件园建工路4号2楼211-212房
法律状态 -

摘要

摘要 本发明公开了一种用于裁判文书的结构化处理方法,包括:S1:读取文书文件并得到文本内容,对所述文本内容进行预处理得到文本数据;S2:设定栏目解析规则以及初始化栏目检索数据结构,生成栏目检索库;S3:利用所述文本数据提取其包含的每行文字信息,得到行文本模块数据;S4:对每个栏目提取关键词,遍历所述行文本模块数据并进行逐行关键词匹配;S5:当匹配成功后提取关键词位置信息,确定栏目取值规则,从而获取该栏目的文本内容以及详细信息;本发明能够将裁判文书结构化处理后存入大数据平台,从而提供便捷快速地获取文书信息的途径,以供法律行业专业人士或当事人搜索。