高并发电商网站的网页数据采集方法、系统和介质
基本信息
申请号 | CN201811519412.0 | 申请日 | - |
公开(公告)号 | CN109697124A | 公开(公告)日 | 2019-04-30 |
申请公布号 | CN109697124A | 申请公布日 | 2019-04-30 |
分类号 | G06F9/50(2006.01)I | 分类 | 计算;推算;计数; |
发明人 | 翁文言; 赵方; 陈志毅; 杨振宗; 阳衡峰; 夏冰 | 申请(专利权)人 | 深圳店匠科技有限公司 |
代理机构 | 深圳协成知识产权代理事务所(普通合伙) | 代理人 | 深圳店匠科技有限公司 |
地址 | 518000 广东省深圳市南山区粤海街道粤兴四道1号中山大学深圳产学研大楼1301 | ||
法律状态 | - |
摘要
摘要 | 本发明公开了一种高并发电商网站的网页数据采集方法、系统和介质,所述方法包括以下步骤:当接收到针对目标网页的网页数据请求时,预分配多个服务器组成至少两个计算集群;通过所述计算集群进行网页数据采集;在网页数据采集过程中,检测各个计算集群的计算资源利用率;当检测到有的计算集群的计算资源利用率高,有的计算集群的计算资源利用率低时,则从计算资源利用率低的计算集群中调配预设数量的服务器到计算资源利用率高的计算集群。从而通过避免了计算资源分配不合理造成的计算资源的浪费或不足,实现了资源的优化配置,提高了计算资源的利用率,进而提高了数据采集效率。 |
