scrapy-redis去重和redis分布式配置问题
来源:10-9 集成bloomfilter到scrapy-redis中
白塔七元
2017-05-16
请教老师:
1、scrapy-redis是去重request,但是我想把爬到的url直接存到redis中也用bloomfilter,该如何实现呢?
2、redis的分布式改如何设置呢?为什么我注释掉bind之后,外网的计算机仍然不能连接本机的redis呢?
写回答
1回答
-
bobby
2017-05-17
不要把url随便放入到redis中, request放进去才是根本, 因为有时候虽然一个是同一个url但是url中有些参数不一致 或者cookie不一致的时候 这个时候是不应该去重的, 所以最好沿用原来的逻辑, 如果要自己做也可以就是直接看课程中我讲过源码 你直接把生成指纹的代码改成直接做md5放进去就行了
bind注释掉可能默认绑定到本地 你把bind地址改为0.0.0.0试试
022017-05-17
相似问题