基于主被动数据融合的互联网数据采集方法及装置

基本信息

申请号 CN201811294367.3 申请日 -
公开(公告)号 CN109361564A 公开(公告)日 2019-02-19
申请公布号 CN109361564A 申请公布日 2019-02-19
分类号 H04L12/26 分类 电通信技术;
发明人 袁振龙;王嘉正 申请(专利权)人 北京赋乐科技有限公司
代理机构 北京路浩知识产权代理有限公司 代理人 王莹;吴欢燕
地址 100084 北京市海淀区清华园北京100084-82信箱
法律状态 -

摘要

摘要 本发明实施例提供一种基于主被动数据融合的互联网数据采集方法及装置,所述方法包括:获取目标用户的行为层数据,并获取所述目标用户的内容层数据,所述行为层数据包含行为执行时间,所述内容层数据包含数据产生时间;根据所述目标用户的身份标识、所述行为执行时间和所述数据产生时间,将所述行为层数据和所述内容层数据融合成完整的数据。本发明实施例提供的基于主被动数据融合的互联网数据采集方法及装置,将被动数据获取的行为层数据与主动数据获取的内容层数据有效融合,在不涉及用户内容隐私的前提下,实现了对互联网行为层数据和内容层数据的完整采集,提高了采集到的用户数据的数据价值,为大数据分析提供了更有价值的数据来源。