新闻资讯聚合分析方法及系统、终端、存储介质

基本信息

申请号 CN202010397390.6 申请日 -
公开(公告)号 CN111581480A 公开(公告)日 2020-08-25
申请公布号 CN111581480A 申请公布日 2020-08-25
分类号 G06F16/951(2019.01)I 分类 -
发明人 舒胜宏 申请(专利权)人 杭州风远科技有限公司
代理机构 上海璀汇知识产权代理事务所(普通合伙) 代理人 杭州风远科技有限公司
地址 310000浙江省杭州市滨江区先锋科技大厦901
法律状态 -

摘要

摘要 本发明公开一种新闻资讯聚合分析方法及系统、终端、存储介质,其中方法主要包括:基于标准聚合接口定义的数据采集配置采集原始数据,根据标准聚合接口定义的结构化规则进行数据聚合;根据聚合器的接口定义的结构化规则和中文分词技术对聚合后的数据进行去重预处理得到结构化数据;根据结构化数据在不同维度的定义进行数据归类,并输出归类报告。采用本发明,在数据采集聚合后,对数据进行去重预处理再进行分析归类,可以为大数据分析提供便捷满足特定需求的可持续化分析处理的过程,解决当下新闻源杂乱、内容结构不统一、新闻资讯量巨大的采集难题。