selenium模拟微博登录后，对某一个url请求，返回来的source

selenium模拟微博登录后，对某一个url请求，返回来的source_page仍没有加载script脚本。

来源：9-2 selenium模拟登录微博，模拟鼠标下拉

宝慕林5723456

2017-06-15

写回答

1回答

bobby

2017-06-16

已采纳

你这里是结合了selenium的模拟登录和scrapy的request了吧， selenium的cookie是不能进入scrapy的request的如果要用selenium模拟登录然后让scrapy可用selenium的cookie 就要自己去设置cookie到scrapy中，具体方法你可以参考scrapy的源码中下的 downloadmiddlewares/cookies.py文件里面有具体的逻辑

bobby

宝慕林5723456

这个设计基本上没有问题不过在爬取的时候如果能用scrapy的request完成的话就尽量使用scrapy完成对于一些复杂的逻辑比如分析登录比较麻烦或者反爬虫比较厉害你可以使用selenium来完成爬取

2017-06-18

共3条回复

Scrapy打造搜索引擎畅销4年的Python分布式爬虫课

带你彻底掌握Scrapy，用Django+Elasticsearch搭建搜索引擎

5831 学习 · 6293 问题

查看课程

相似问题

新浪微博模拟登录，验证码问题

回答 1