bitmap VS bloomfilter

来源:10-9 集成bloomfilter到scrapy-redis中

我在汴梁城边

2019-06-22

bitmap用一个hash函数分配到bit的0或1

bloomfilter 用K个hash函数指定k个(0或1),只有全是1才抓取过

假如我又M个数据,bitmap使用内存是M个bit,bloomfiter需要KM个bit

可以这么理解吗

写回答

1回答

bobby

2019-06-24

不能这样简单理解, bitmap的数量肯定是要大于M个bit的,不可能做到刚好m个数据就要m个bit位置,会有一定比例的大于初始化的数据量的,不同的初始化大小的连续bit空间会对错误率有不同的影响的,课程中的bloomfilter会更具你的预计数量和错误率计算出需要的空间大小的

0
0

Scrapy打造搜索引擎 畅销4年的Python分布式爬虫课

带你彻底掌握Scrapy,用Django+Elasticsearch搭建搜索引擎

5796 学习 · 6290 问题

查看课程