将selenium集成到scrapy后,爬取cnblogs下载图片报错了。集成后怎么解决图片下载问题呢?

来源:9-4 selenium集成到scrapy中

楚人长铗

2020-02-09

图片描述图片描述图片描述图片描述
在imagepipeline 中解决吗?

写回答

1回答

bobby

2020-02-10

是所有的图片都下载失败 还是只有个别 这个url的图片 你有没有试过通过浏览器是否能打开?

0
3
bobby
回复
楚人长铗
JSPageMiddleware可以区别开来,如果遇到cnblogs的情况就不应该使用这个组件:1. 通过url区别开来 2. 不同的爬虫自定义配置文件,这个课程中后面会讲解
2020-02-20
共3条回复

Scrapy打造搜索引擎 畅销4年的Python分布式爬虫课

带你彻底掌握Scrapy,用Django+Elasticsearch搭建搜索引擎

5795 学习 · 6290 问题

查看课程