检测是否是新老用户为什么要用Keyed State

来源:10-8 功能二之实现02

慕少7351152

2022-07-22

啊老师是我想错了,没有问题了。。

===== 我是分割线========
老师好,
这一节用bloomfilter检测新老用户,我个人觉得这个动作是不是应该属于清洗过程,不应该和keyby操作相关联,因为我看到官网说keyBy之后的state是局部化在各个处理特定key的算子上的,即处理这部分key的算子只拥有这部分key的state。

这次的keyby是日志的deviceType字段,不同deviceType的数据的device id确实不一样,但是如果下次keyby是通过比如event,或者product的话,这样的顺序可能会出问题吧(当然也跟怎么定义 新用户 有关)

写回答

1回答

Michael_PK

2024-09-24

1)你的问题问的很好,实现一个功能不一定非要使用什么什么技术,适合自己的、适合团队的才是最好的。

2)bloomfilter有个非常大的好处就是,能装很多的内容在里面,而且不占用太大的空间,能起到全局的作用。

3)你说的很对,关于新用户的定义,我相信每家公司的定义方式可能都不太一样,这个其实就是跟产品同学的定义有很大关系

0
0

Flink+ClickHouse 玩转企业级实时大数据开发

已经在做大数据,Flink助力轻松提薪;尚未入行,让你弯道超车

1000 学习 · 225 问题

查看课程