老师,我项目需要每次request都要selenium做代理,那这样,我怎么把页面信息传入response后,还从操作浏览器呢

来源:2-1 pycharm的安装和简单使用

慕工程0405147

2021-04-29

老师,我项目需要每次request都要selenium做代理,那这样,我怎么把页面信息传入response后,还从操作浏览器呢

写回答

1回答

bobby

2021-04-29

课程中讲解了中间件的,你直接写一个middleware,直接拦截request请求然后使用selenium获取,原本这个request是要发送给downloader的,但是你拦截了并且直接return 了response了,那么原本应该交给downloader下载的就不会交给了,直接返回reponse就进入了你自己的处理逻辑了

0
3
慕工程0405147
回复
bobby
老师,我现在是代码在本地无论是命令行模式,还是ide去执行,都是正常,但是就是到了线上centos7里,scrapy就执行不起来selenium,但是在线上直接调用selenium又是正常的....
2021-05-08
共3条回复

Scrapy打造搜索引擎 畅销4年的Python分布式爬虫课

带你彻底掌握Scrapy,用Django+Elasticsearch搭建搜索引擎

5795 学习 · 6290 问题

查看课程