rowkey的设计问题

来源:4-15 功能开发之HBase Rowkey设计_1

哆啦A梦爱学习吖

2020-09-13

老师,我不太理解这个rowkey设计的思路,rowkey的设计目的是为了数据能够尽量均匀分配到各个regionserver,按照课程里设计:
day+crc32(referer+url+ip+ua)
虽然可能是满足了唯一性,但是要怎么确定这个设计满足了结合业务查询的需要?还有为什么hbase已经设计为一天一个表,但是rowkey还要加上day呢?

写回答

2回答

慕沐6014767

2022-05-17

这样好像做不到唯一性吧,假如有数据的这几个字段都一样的话,那行键也相同了
0
1
Michael_PK
你说的这种是有些许可能性的,你可以再继续加时间戳进去吗,同一时间点同一ip,就更精准了
2022-05-21
共1条回复

Michael_PK

2020-09-13

rk的设计是为了scan的时候能给更快,我们这里加了个时间在前面,那么在查找的时候直接可以通过开头的时间去扫描到

0
4
哆啦A梦爱学习吖
回复
Michael_PK
哦哦,明白
2020-09-13
共4条回复

Spark进阶 大数据离线与实时项目实战

大数据生态圈实用框架(Spark/Hbase/Redis/Hadoop)整合应用及调优

700 学习 · 190 问题

查看课程