关于程序停止下次再继续爬取的问题

来源:8-8 进一步的思考 - 课后作业

weixin_慕无忌0272843

2022-08-01

比如一级url等放到一个redis库中,从中取出并请求每个一级url的二级url. 某个一级url处理到一半,突然程序停止。这个一级url可能已经从库里删除了,但是它还有一部分二级url没爬去到。如何保证下一次爬取数据时能把这一部分的二级url爬取到

写回答

1回答

bobby

2022-08-02

一级url被删除了, 为什么二级的url会丢了?

0
2
bobby
回复
weixin_慕无忌0272843
退出有报错信息吗? 最好截图看看日志
2022-08-07
共2条回复

Python爬虫工程师实战 大数据时代必备

慕课网严选精品教程,高质量内容+服务!

2381 学习 · 1158 问题

查看课程