一种文件关联方法及系统
基本信息
申请号 | CN201610832684.0 | 申请日 | - |
公开(公告)号 | CN107844493B | 公开(公告)日 | 2018-03-27 |
申请公布号 | CN107844493B | 申请公布日 | 2018-03-27 |
分类号 | G06F16/33(2019.01)I;G06F40/30(2020.01)I | 分类 | 计算;推算;计数; |
发明人 | 米维聪;席强辉;徐超 | 申请(专利权)人 | 博彦泓智科技(上海)有限公司 |
代理机构 | 上海光华专利事务所(普通合伙) | 代理人 | 博彦泓智科技(上海)有限公司 |
地址 | 200335上海市长宁区金钟路968号3号楼608室(实际楼层5层) | ||
法律状态 | - |
摘要
摘要 | 本发明提供一种文件关联方法及系统,该方法包括:接收一原文件;提取原文件的标题,将标题相似度达到标题相似度阈值的各标题存储条目所对应的文件作为原文件的标题近似文件;提取原文件的大纲,将大纲综合相似度达到大纲相似度阈值的各文件大纲所对应的文件作为原文件的大纲近似文件;提取原文件的正文,将正文综合相似度达到正文相似度阈值的各文件正文所对应的文件作为原文件的正文近似文件;将标题近似文件、大纲近似文件、或/和正文近似文件的标题相似度、大纲综合相似度和正文综合相似度根据预设权值进行加权处理,获得各近似文件的综合近似度。本发明运算复杂度低,节约了比对时间和成本;对比运算逻辑紧密,提高了对比结果的准确度。 |
