为什么ip中间件不是一个yield请求启动一个代理ip,而是有时候一个yield请求重复启动的同一个中间件ip

来源:15-1 es完成搜索建议-搜索建议字段保存 - 1

慕先生0421411

2017-08-30

http://szimg.mukewang.com/59a65eae0001a0ac08290260.jpg

http://szimg.mukewang.com/59a65eae0001584218460308.jpg


写回答

1回答

bobby

2017-08-31

亲 如果你这个是中间件的话 每个request都会经过这个函数处理, 如果都是同一个ip的话 那就是random取到了同一个ip 也有可能是你这个302或者请求失败的时候 直接scrapy发起了多次尝试相同请求 这个时候request都是一样的了

0
3
bobby
回复
慕先生0421411
https://stackoverflow.com/questions/22795416/how-to-handle-302-redirect-in-scrapy 你看看这个 302的时候 你最好是先搞懂原因 如果是定位到登录页面了 说明所有剩余的request可能都会被定向到登录页面, 这个时候你可以跳转到登录函数去实现登录逻辑
2017-09-01
共3条回复

Scrapy打造搜索引擎 畅销4年的Python分布式爬虫课

带你彻底掌握Scrapy,用Django+Elasticsearch搭建搜索引擎

5795 学习 · 6290 问题

查看课程