老师:关于boolmfilter的问题
来源:10-9 集成bloomfilter到scrapy-redis中
慕粉1724417796
2017-05-16
boolmfilter一定要先设置占用内存大小吗?我还没爬数据就占用4个G,我调了capacity=100000000, error_rate=0.0000001这两个参数,才把占用降低了,能不能不设置内存块?
写回答
3回答
-
慕粉1724417796
提问者
2017-05-20
老师:可是降低capacity的话,url去重的数量也降低了啊
012017-05-21 -
慕粉1724417796
提问者
2017-05-19
老师你意思是通过降低error_rate?
012017-05-19 -
bobby
2017-05-17
亲, bloomfilter的原理是通过bit为来判断的, 所以需要连续的内存块, 连续的内存块就需要预分配,所以需要指明大小, 不过一般200m左右就可以满足上亿的url爬取, 所以你可以设置小一点就行了
00
相似问题