布隆过滤器
来源:10-9 集成bloomfilter到scrapy-redis中
黎明的烬
2019-04-24
输入正文最近突发奇想,想测试下布隆过滤器,感觉URL量变大之后,存储真的好慢啊
然后还会报这个错误:
Traceback (most recent call last):
File "D:/pyworkSpace/ENV/scrapy/Scripts/article_spider/article_spider/utils/bloomfilter.py", line 87, in <module>
if not bf.is_exist(test_url):
File "D:/pyworkSpace/ENV/scrapy/Scripts/article_spider/article_spider/utils/bloomfilter.py", line 47, in is_exist
name = self.key + "_" + str(ord(value[0]) % self.blocknum)
IndexError: string index out of range
写回答
2回答
-
这个异常和数据大小没有关系,为了解决这个问题你最好先看一下这个异常出现的地方,debug一下是哪个地方出问题了
0132019-05-15 -
黎明的烬
提问者
2019-05-01
布隆过滤器
00
相似问题
问题
回答 1
老师这个下载速度非常慢
回答 1