老师,scrapy的并发是多线程吗

来源:6-18 知乎spider爬虫逻辑的实现以及answer的提取 - 2

生晟

2019-09-29

老师,scrapy的并发是多线程吗

写回答

1回答

bobby

2019-10-01

scrapy的高并发不是多线程,而是基于twisted的事件循环+epoll实现的,这个比多线程并发高,但是有很大的限制就是在代码中不能写同步方法,不然很多时候会适得其反。但是很多库都是同步的接口,所以为了解决这个问题twisted在启动的时候会启动一个线程池,如果遇到有同步的方法可以扔到这个线程池中去执行,不过这些需要你对twisted比较熟悉才行

0
0

Scrapy打造搜索引擎 畅销4年的Python分布式爬虫课

带你彻底掌握Scrapy,用Django+Elasticsearch搭建搜索引擎

5796 学习 · 6290 问题

查看课程