基于代理的侵入式社交数据采集方法
基本信息
申请号 | CN201910037397.4 | 申请日 | - |
公开(公告)号 | CN109831491B | 公开(公告)日 | 2022-03-15 |
申请公布号 | CN109831491B | 申请公布日 | 2022-03-15 |
分类号 | H04L67/02(2022.01)I;H04L67/141(2022.01)I;H04L67/56(2022.01)I;H04L9/40(2022.01)I;G06F16/951(2019.01)I | 分类 | 电通信技术; |
发明人 | 李森;李凌悦;苏磊 | 申请(专利权)人 | 科大国创软件股份有限公司 |
代理机构 | 合肥洪雷知识产权代理事务所(普通合伙) | 代理人 | 孙小华 |
地址 | 230000安徽省合肥市高新区文曲路355号 | ||
法律状态 | - |
摘要
摘要 | 本发明公开了一种基于代理的侵入式社交数据采集方法,涉及信息采集领域。本发明包括微信客户端、代理服务器、程序服务器和微信服务器;利用抓包工具获取服务端返回给客户端的数据包,注入JS并返还给客户端,在客户端加载页面时自动执行JS代码,使浏览器与程序建立连接,程序向浏览器发送指令控制整个采集流程。本发明通过下拉操作加载更多数据,抓取完文章链接,接着执行详情链接获取文章内容、点赞数、阅读数和评论等,公众号文章采集数据全面,操作简单,提高了数据采集效率。 |
