检测是否是新老用户为什么要用Keyed State
来源:10-8 功能二之实现02

慕少7351152
2022-07-22
啊老师是我想错了,没有问题了。。
===== 我是分割线========
老师好,
这一节用bloomfilter检测新老用户,我个人觉得这个动作是不是应该属于清洗过程,不应该和keyby操作相关联,因为我看到官网说keyBy之后的state是局部化在各个处理特定key的算子上的,即处理这部分key的算子只拥有这部分key的state。
这次的keyby是日志的deviceType字段,不同deviceType的数据的device id确实不一样,但是如果下次keyby是通过比如event,或者product的话,这样的顺序可能会出问题吧(当然也跟怎么定义 新用户 有关)
写回答
1回答
-
Michael_PK
2024-09-24
1)你的问题问的很好,实现一个功能不一定非要使用什么什么技术,适合自己的、适合团队的才是最好的。
2)bloomfilter有个非常大的好处就是,能装很多的内容在里面,而且不占用太大的空间,能起到全局的作用。
3)你说的很对,关于新用户的定义,我相信每家公司的定义方式可能都不太一样,这个其实就是跟产品同学的定义有很大关系
00
相似问题