不同文档中相关句子的匹配方法、系统和计算机可读存储介质
基本信息
申请号 | CN202010559644.X | 申请日 | - |
公开(公告)号 | CN112380830A | 公开(公告)日 | 2021-02-19 |
申请公布号 | CN112380830A | 申请公布日 | 2021-02-19 |
分类号 | G06F40/194(2020.01)I;G06F40/216(2020.01)I | 分类 | 计算;推算;计数; |
发明人 | 王忠萌;陈运文;王文广;贺梦洁;胡盟;纪达麒 | 申请(专利权)人 | 达观数据有限公司 |
代理机构 | 上海智力专利商标事务所(普通合伙) | 代理人 | 张文玄;周涛 |
地址 | 201203上海市浦东新区亮秀路112号B座301、303、304室 | ||
法律状态 | - |
摘要
摘要 | 本发明公开了一种不同文档中相关句子的匹配方法,用于将基准文档中的基准句子和比对文档中的候选句子进行匹配,所述匹配方法包括:在浅层语义、统计信息、深层语义三个层面上,计算候选句子相对于基准句子的表示匹配程度的浅层分数、统计分数、深层分数;基于线性回归模型拟合所述浅层分数、统计分数和深层分数,获得用来表示所述候选句子相对于基准句子的匹配度的最终分数。本发明提高文档匹配准确性。 |
