我这样爬取有问题么

来源：11-5 通过收费的代理ip绕过反爬 - 2

慕无忌8052570

2020-09-19

老师，我有个思路：爬取小说的时候，先把1000页的小说列表获取完，然后查询数据库取每本书的链接去获取目录，再去获取书的内容

A所有小说列表
B所有小说目录
C所有小说内容

A----->B------>C

这个我去实现了，但是走不通。是不是我的思路有问题，或者不能这样操作

写回答

4回答

慕无忌8052570

提问者

2020-09-21

//img1.sycdn.imooc.com/szimg/5f688eb5099557c723900780.jpg

是不是循环里面不能开线程么，

慕无忌8052570

提问者

2020-09-21

//img.mukewang.com/szimg/5f68446b08eca5da16761180.jpg 我这样执行会导致什么呢

慕无忌8052570

提问者

2020-09-21

因为小说列表开了10个线程，小说目录也开了10个线程，导致列表没跑完，就跑目录了

bobby

慕无忌8052570

好的。

2020-10-08

共3条回复

bobby

2020-09-20

行不通是什么意思有什么问题？思路听起来没有什么问题

Python爬虫工程师实战大数据时代必备

慕课网严选精品教程，高质量内容+服务！

2406 学习 · 1158 问题

相似问题

回答 2

回答 1

回答 2

回答 1

回答 1