一种实现合同条款位置自动识别实现的方法

基本信息

申请号 CN201910002041.7 申请日 -
公开(公告)号 CN109857994A 公开(公告)日 2019-06-07
申请公布号 CN109857994A 申请公布日 2019-06-07
分类号 G06F17/22(2006.01)I; G06F17/27(2006.01)I; G06F16/35(2019.01)I 分类 计算;推算;计数;
发明人 尚宏金 申请(专利权)人 深圳市找大状法务科技有限公司
代理机构 北京联瑞联丰知识产权代理事务所(普通合伙) 代理人 张清彦
地址 518000 广东省深圳市南山区粤海街道德赛科技大厦23层2301-2302号
法律状态 -

摘要

摘要 本发明公开了一种实现合同条款位置自动识别实现的方法,该方法包括以下步骤:收集若干某一类型合同,在这些某一类型合同中标注出每个条款的起始结束位置;针对每个条款的每份数据进行分词、去停词处理,得到词袋模型,并记录下该词袋模型对应的条款序号,使用机器学习方法用词袋模型和条款序号的组合数据进行训练,得到合同中每个条款的区分模型,并保存在二进制文件中;确认新合同的合同类型,所述条款定位方法包括把新合同的每一个自然段使用区分模型计算每个条款的概率,得到新合同的概率矩阵,对每个条款,对应概率矩阵中每一列,使用其对应列的数据进行定位起始结束位置。该发明自动给合同涉及到的各个条款找到起始、结束位置。