获取了登录后的cookie无法获取具体信息

来源：7-5 网页302之后的模拟登录和cookie传递(网站需要登录时学习本视频教程)

慕粉1468990971

2019-08-05

请问老师我登录成功获取到了cookie，用这个cookie去requests请求拉钩首页都是正常的，也显示了我的用户名，但带上登录成功后的cookie去请求https://www.lagou.com/jobs/list_{position_encode}?px=default&city={city_encode}&district={district_encode}这样的url还是会说操作太频繁，而不带这个cookie却能获取到十页左右的信息再让登录，请问这是怎么回事

写回答

1回答

bobby

2019-08-06

其实还是很简单的，首先拉钩可以通过ip去限制你的访问频率比如同一个ip访问过快很容易就初步判定你为爬虫这个时候就让你登录，但是你登录了以后就更加容易用来做判断了，比如可以通过账号或者ip同时去判断爬虫。所以最重要的是控制访问频率和速度，不要访问的太频繁了，或者不登录使用ip代理访问。但是拉钩已经将很多ip地址加入到疑似爬虫的池中了，所以最重要的还是注意控制访问速度，如果还是觉得麻烦可以考虑使用selenium访问

bobby

慕粉1468990971

当然频繁了啊哪有人工一天能访问3万次的，而且没10秒获取一次这么规律的请求也不符合正常人的访问一遍限制爬虫都会设置一个ip一天能访问的上限

2019-08-08

共2条回复

Scrapy打造搜索引擎畅销4年的Python分布式爬虫课

带你彻底掌握Scrapy，用Django+Elasticsearch搭建搜索引擎

5831 学习 · 6293 问题

查看课程

相似问题

用crawlSpider对拉钩网爬取，出现302的状态码，意思是要先用scrapy登录，才能爬取吗？

回答 1