一种新闻传播溯源的分析方法

基本信息

申请号 CN202010303524.3 申请日 -
公开(公告)号 CN111522912A 公开(公告)日 2020-08-11
申请公布号 CN111522912A 申请公布日 2020-08-11
分类号 G06F16/33(2019.01)I 分类 -
发明人 徐利东;远贵良 申请(专利权)人 山东贝赛信息科技有限公司
代理机构 济南瑞宸知识产权代理有限公司 代理人 山东贝赛信息科技有限公司
地址 250000山东省济南市经十路7000号汉峪金谷金融商务中心A4-(3)办公楼34层3401室
法律状态 -

摘要

摘要 本发明公开了一种新闻传播溯源的分析方法,新闻传播溯源的分析步骤如下:数据采集网页、编码处理、编码比对、比较相似度、相似文章输出排序、输出结果。本发明提供了一种分析准确、全面的新闻传播溯源方法。本发明基于相似文本识别技术同时分析网页URL、作者、数据源等相关属性。本发明准确率提升,溯源结果达到领先水平,溯源计算性能高,支持海量数据的溯源分析。