一种裁判文书结构化处理方法及系统
基本信息

| 申请号 | CN201910893066.0 | 申请日 | - |
| 公开(公告)号 | CN110750974A | 公开(公告)日 | 2020-02-04 |
| 申请公布号 | CN110750974A | 申请公布日 | 2020-02-04 |
| 分类号 | G06F40/186;G06Q50/18 | 分类 | 计算;推算;计数; |
| 发明人 | 不公告发明人 | 申请(专利权)人 | 成都星云律例科技有限责任公司 |
| 代理机构 | 成都行之专利代理事务所(普通合伙) | 代理人 | 熊曦 |
| 地址 | 610000 四川省成都市高新区锦晖西一街99号2栋1单元19楼1909号 | ||
| 法律状态 | - | ||
摘要

| 摘要 | 本发明公开了一种裁判文书结构化处理方法及系统,所述方法包括:建立裁判文书语料库;分析裁判文书结构;标注裁判文书,将标注的裁判文书划分为训练集和验证集;构建语言模型并预训练;计算预训练语言模型的损失函数;将训练集输入预训练语言模型,输出训练集中裁判文书的向量表示;利用该向量及训练集标注数据训练预测分段模型,获得初步的预测分段模型;将验证集输入预训练语言模型,将输出的向量输入初步预测分段模型,对比输出的分段结果与裁判文书标注调整优化预测分段模型,得到最优预测分段模型;利用本发明可提升裁判文书结构化处理准确率,降低对人工核查的依赖,提升裁判文书结构化处理效率。 |





