爬取拉勾网,重定向302

来源:8-9 云打码实现验证码识别

梦想有天能够飞起来

2019-03-04

打开页面看见提示账号异常,需要输入验证码。

2019-03-04 22:47:26 [scrapy.downloadermiddlewares.redirect] DEBUG: Redirecting (302) to <GET https://www.lagou.com/utrack/trackMid.htmlf=https%3A%2F%2Fwww.lagou.com%2Fjobs%2F5646424.html&t=1551710848&_ti=1> from <GET https://www.lagou.com/jobs/5646424.html>

老师,这个有没有什么好的解决办法?

scrapy是如何处理重定向的呀?

写回答

2回答

Mobyszh

2019-04-06

我设置了请求间隔60s,目前状况良好

0
0

bobby

2019-03-07

这个是出现302了 出现这个是因为你的抓取速度过快 被目标网站限制了,你需要限速一下 控制你的抓取速度, 你可以先手动输入验证码 解封你的账号 然后再限速重新抓取

0
4
梦想有天能够飞起来
回复
bobby
已经加了
2019-03-12
共4条回复

Scrapy打造搜索引擎 畅销4年的Python分布式爬虫课

带你彻底掌握Scrapy,用Django+Elasticsearch搭建搜索引擎

5795 学习 · 6290 问题

查看课程