基于代理的侵入式社交数据采集方法

基本信息

申请号 CN201910037397.4 申请日 -
公开(公告)号 CN109831491B 公开(公告)日 2022-03-15
申请公布号 CN109831491B 申请公布日 2022-03-15
分类号 H04L67/02(2022.01)I;H04L67/141(2022.01)I;H04L67/56(2022.01)I;H04L9/40(2022.01)I;G06F16/951(2019.01)I 分类 电通信技术;
发明人 李森;李凌悦;苏磊 申请(专利权)人 科大国创软件股份有限公司
代理机构 合肥洪雷知识产权代理事务所(普通合伙) 代理人 孙小华
地址 230000安徽省合肥市高新区文曲路355号
法律状态 -

摘要

摘要 本发明公开了一种基于代理的侵入式社交数据采集方法,涉及信息采集领域。本发明包括微信客户端、代理服务器、程序服务器和微信服务器;利用抓包工具获取服务端返回给客户端的数据包,注入JS并返还给客户端,在客户端加载页面时自动执行JS代码,使浏览器与程序建立连接,程序向浏览器发送指令控制整个采集流程。本发明通过下拉操作加载更多数据,抓取完文章链接,接着执行详情链接获取文章内容、点赞数、阅读数和评论等,公众号文章采集数据全面,操作简单,提高了数据采集效率。