我这样爬取有问题么

来源:11-5 通过收费的代理ip绕过反爬 - 2

慕无忌8052570

2020-09-19

老师,我有个思路:爬取小说的时候,先把1000页的小说列表获取完,然后查询数据库取每本书的链接去获取目录,再去获取书的内容

A所有小说列表
B所有小说目录
C所有小说内容

A----->B------>C

这个我去实现了,但是走不通。是不是我的思路有问题,或者不能这样操作

写回答

4回答

慕无忌8052570

提问者

2020-09-21

//img1.sycdn.imooc.com/szimg/5f688eb5099557c723900780.jpg

是不是循环里面不能开线程么,   

0
0

慕无忌8052570

提问者

2020-09-21

//img.mukewang.com/szimg/5f68446b08eca5da16761180.jpg我这样执行会导致什么呢

0
0

慕无忌8052570

提问者

2020-09-21

因为小说列表开了10个线程,小说目录也开了10个线程,导致列表没跑完,就跑目录了

0
3
bobby
回复
慕无忌8052570
好的。
2020-10-08
共3条回复

bobby

2020-09-20

行不通是什么意思 有什么问题? 思路听起来没有什么问题

0
0

Python爬虫工程师实战 大数据时代必备

慕课网严选精品教程,高质量内容+服务!

2377 学习 · 1158 问题

查看课程