为什么在遍历yield出去的url时,有时候会丢失没有采集到,是跟网络有关吗?

来源:1-1 python分布式爬虫打造搜索引擎简介

Richelieu1780

2021-08-12

怎么能够稳定采集成功

写回答

1回答

bobby

2021-08-13

为什么感觉到没有采集到?有没有看看日志是否是出现了非200状态码?

0
2
bobby
回复
Richelieu1780
那应该是某个的状态码不是200,你可以看看日志,日志也会统计爬取了多少个的
2021-08-16
共2条回复

Scrapy打造搜索引擎 畅销4年的Python分布式爬虫课

带你彻底掌握Scrapy,用Django+Elasticsearch搭建搜索引擎

5795 学习 · 6290 问题

查看课程