获取了登录后的cookie无法获取具体信息
来源:7-5 网页302之后的模拟登录和cookie传递(网站需要登录时学习本视频教程)
慕粉1468990971
2019-08-05
请问老师我登录成功获取到了cookie,用这个cookie去requests请求拉钩首页都是正常的,也显示了我的用户名,但带上登录成功后的cookie去请求https://www.lagou.com/jobs/list_{position_encode}?px=default&city={city_encode}&district={district_encode}这样的url还是会说操作太频繁,而不带这个cookie却能获取到十页左右的信息再让登录,请问这是怎么回事
写回答
1回答
-
bobby
2019-08-06
其实还是很简单的,首先拉钩可以通过ip去限制你的访问频率 比如同一个ip访问过快 很容易就初步判定你为爬虫 这个时候就让你登录,但是你登录了以后就更加容易用来做判断了,比如可以通过账号或者ip同时去判断爬虫。所以最重要的是控制访问频率和速度,不要访问的太频繁了,或者不登录使用ip代理访问。但是拉钩已经将很多ip地址加入到疑似爬虫的池中了,所以最重要的还是注意控制访问速度,如果还是觉得麻烦可以考虑使用selenium访问
022019-08-08
相似问题