布隆过滤器这里的哈希为什么只哈希四位字符 (比如ACCG),为什么不直接哈希ACCGTAG ?
来源:8-3 缓存设计面试专题-(2)

luluoverflow
2021-04-06
如题~
写回答
1回答
-
同学你好, 这个问题提的很好。
布隆过滤器的思路是用多个位代表一个串存不存在。
比如说ACCGTAG -> ACCG CGTA GTAG , 然后hash 3个,对应3个比特。 那么判断的准确率就高。如果直接hash,对应的是一个bit,冲突率高,准确率低。
核心问题是,布隆过滤器要节省空间。用少量的空间,给出一个模糊的判断。
112021-04-07
相似问题