获取了登录后的cookie无法获取具体信息

来源:7-5 网页302之后的模拟登录和cookie传递(网站需要登录时学习本视频教程)

慕粉1468990971

2019-08-05

请问老师我登录成功获取到了cookie,用这个cookie去requests请求拉钩首页都是正常的,也显示了我的用户名,但带上登录成功后的cookie去请求https://www.lagou.com/jobs/list_{position_encode}?px=default&city={city_encode}&district={district_encode}这样的url还是会说操作太频繁,而不带这个cookie却能获取到十页左右的信息再让登录,请问这是怎么回事

写回答

1回答

bobby

2019-08-06

其实还是很简单的,首先拉钩可以通过ip去限制你的访问频率 比如同一个ip访问过快 很容易就初步判定你为爬虫 这个时候就让你登录,但是你登录了以后就更加容易用来做判断了,比如可以通过账号或者ip同时去判断爬虫。所以最重要的是控制访问频率和速度,不要访问的太频繁了,或者不登录使用ip代理访问。但是拉钩已经将很多ip地址加入到疑似爬虫的池中了,所以最重要的还是注意控制访问速度,如果还是觉得麻烦可以考虑使用selenium访问

0
2
bobby
回复
慕粉1468990971
当然频繁了啊 哪有人工一天能访问3万次的,而且没10秒获取一次 这么规律的请求也不符合正常人的访问 一遍限制爬虫都会设置一个ip一天能访问的上限
2019-08-08
共2条回复

Scrapy打造搜索引擎 畅销4年的Python分布式爬虫课

带你彻底掌握Scrapy,用Django+Elasticsearch搭建搜索引擎

5829 学习 · 6293 问题

查看课程