一种海量相似新闻查重甄选方法、系统及装置
基本信息
申请号 | CN201711350335.6 | 申请日 | - |
公开(公告)号 | CN108280127A | 公开(公告)日 | 2018-07-13 |
申请公布号 | CN108280127A | 申请公布日 | 2018-07-13 |
分类号 | G06F17/30 | 分类 | 计算;推算;计数; |
发明人 | 张毅 | 申请(专利权)人 | 广州艾媒数聚信息咨询股份有限公司 |
代理机构 | 广州嘉权专利商标事务所有限公司 | 代理人 | 广州艾媒数聚信息咨询股份有限公司 |
地址 | 510006 广东省广州市番禺区小谷围街青蓝街26号701房 | ||
法律状态 | - |
摘要
摘要 | 本发明公开了一种海量相似新闻查重甄选方法、系统及装置,方法包括:从各个新闻源中获取新闻文章;对获取的新闻文章进行快速查重处理和关键词查重处理,得到查重结果;将查重结果发送至编辑进行处理。本发明通过快速查重和关键词查重结合进行新闻查重,从而在文章结构及文章中心思想两个层面都保证了查重的效果,在提高了查重的准确性的同时,也大大提升了工作效率,有效满足了新闻媒体行业查重的需求。本发明可广泛应用于新闻领域中。 |
