基于Hadoop大数据处理技术的日志分析系统

基本信息

申请号 CN201610006805.6 申请日 -
公开(公告)号 CN105677842A 公开(公告)日 2016-06-15
申请公布号 CN105677842A 申请公布日 2016-06-15
分类号 G06F17/30(2006.01)I 分类 计算;推算;计数;
发明人 许丹霞;刘寅;汪伟;郑宇 申请(专利权)人 北京汇商融通信息技术有限公司
代理机构 北京迎硕知识产权代理事务所(普通合伙) 代理人 吕良;张群峰
地址 100028 北京市大兴区经济开发区科苑路18号华商创意4号楼
法律状态 -

摘要

摘要 本发明公开了一种基于Hadoop平台开发的企业网站日志分析系统,主要分为五个模块,分别是文件上传模块、数据清洗模块、数据统计分析模块、数据导出模块、数据展现模块。可以计算得到网站各大关键指标,包括浏览量PV、注册用户数、ip数、跳出率,数据的展现可以实现海量数据的毫秒级查询。