一种基于大数据挖掘的互联网资源质量评估方法及系统

基本信息

申请号 CN201310467352.3 申请日 -
公开(公告)号 CN103530347B 公开(公告)日 2016-09-14
申请公布号 CN103530347B 申请公布日 2016-09-14
分类号 G06F17/30(2006.01)I 分类 计算;推算;计数;
发明人 刘岩松;徐信信 申请(专利权)人 北京东方网信科技股份有限公司
代理机构 北京法思腾知识产权代理有限公司 代理人 杨小蓉;杨青
地址 100190 北京市海淀区成府路270号中科科仪大厦1号楼3层
法律状态 -

摘要

摘要 本发明提供了一种基于大数据挖掘的互联网资源质量评估方法及系统,所述方法包含:步骤101)采集互联网数据,采用抽样或随机的方式得到海量样本数据;步骤102)通过数据挖掘去除样本数据的噪声点,使样本数据具有平滑性;步骤103)使用K?Means算法得出样本数据的及格值和刻度,从而确定样本数据的若干指标的分数;步骤104)依据互联网资源质量评估的相关指标,确定互联网资源的质量评估模型;步骤105)基于得到的各指标的分数和质量评估模型,确定互联网资源质量的评估结果。本发明的技术方案可以为网络运营商和ICP运营商提高用户感知质量提供数据决策支持完善和健全的质量评分模型,使得最终数据的质量分数更加准确。