一种用于裁判文书的结构化处理方法及处理装置
基本信息
申请号 | CN201911333386.7 | 申请日 | - |
公开(公告)号 | CN111078839A | 公开(公告)日 | 2020-04-28 |
申请公布号 | CN111078839A | 申请公布日 | 2020-04-28 |
分类号 | G06F16/33;G06F40/289;G06Q50/18 | 分类 | 计算;推算;计数; |
发明人 | 王可佳;张树军;尹士朝;谭宁;张贵森 | 申请(专利权)人 | 广州佳都数据服务有限公司 |
代理机构 | 北京睿智保诚专利代理事务所(普通合伙) | 代理人 | 周新楣 |
地址 | 510000 广东省广州市天河区软件园建工路4号2楼211-212房 | ||
法律状态 | - |
摘要
摘要 | 本发明公开了一种用于裁判文书的结构化处理方法,包括:S1:读取文书文件并得到文本内容,对所述文本内容进行预处理得到文本数据;S2:设定栏目解析规则以及初始化栏目检索数据结构,生成栏目检索库;S3:利用所述文本数据提取其包含的每行文字信息,得到行文本模块数据;S4:对每个栏目提取关键词,遍历所述行文本模块数据并进行逐行关键词匹配;S5:当匹配成功后提取关键词位置信息,确定栏目取值规则,从而获取该栏目的文本内容以及详细信息;本发明能够将裁判文书结构化处理后存入大数据平台,从而提供便捷快速地获取文书信息的途径,以供法律行业专业人士或当事人搜索。 |
