关于boss直聘的反爬
来源:12-5 scrapy集成随机useragent和ip代理

qq_焦良_0
2020-03-22
老师,我爬取boss直聘的数据时发现请求网页会先返回一段js代码设置cookie,同时又设置IP限速,使用IP代理就无法突破cookie限制,因此我想咨询一下,这种IP限速加cookie限制的反爬导致了爬虫速度十分慢有什么办法能解决吗
写回答
3回答
-
这种应该是将cookie和ip绑定了,所以你的一个cookie换个ip用同样的cookie也会被识别,这种反爬难度也不大,你可以购买一些高质量的代理ip,固定一下ip 每个ip拿到cookie以后 就用这个ip定时抓取,多用一些ip就可以了
012020-03-23 -
bobby
2020-03-24
阿布云这个有锁定ip的啊
032020-03-24 -
qq_焦良_0
提问者
2020-03-23
老师可以给几个购买IP的途径,阿布云好像没有找到我需要的
00
相似问题