关于boss直聘的反爬

来源:12-5 scrapy集成随机useragent和ip代理

qq_焦良_0

2020-03-22

老师,我爬取boss直聘的数据时发现请求网页会先返回一段js代码设置cookie,同时又设置IP限速,使用IP代理就无法突破cookie限制,因此我想咨询一下,这种IP限速加cookie限制的反爬导致了爬虫速度十分慢有什么办法能解决吗

写回答

3回答

bobby

2020-03-23

这种应该是将cookie和ip绑定了,所以你的一个cookie换个ip用同样的cookie也会被识别,这种反爬难度也不大,你可以购买一些高质量的代理ip,固定一下ip 每个ip拿到cookie以后 就用这个ip定时抓取,多用一些ip就可以了

0
1
qq_焦良_0
老师可以给几个购买IP的途径,阿布云好像没有我需要的这种IP服务
2020-03-23
共1条回复

bobby

2020-03-24

//img1.sycdn.imooc.com/szimg/5e797b110913d35812100576.jpg 阿布云这个有锁定ip的啊

0
3
qq_焦良_0
回复
bobby
好的,谢谢老师
2020-03-24
共3条回复

qq_焦良_0

提问者

2020-03-23

老师可以给几个购买IP的途径,阿布云好像没有找到我需要的

0
0

Python爬虫工程师实战 大数据时代必备

慕课网严选精品教程,高质量内容+服务!

2377 学习 · 1158 问题

查看课程