请教老师 这些都是离线的 存在延迟,如果要实时的 这个思路是怎么样的?

来源:6-3 使用Spark-ml实现基于朴素贝叶斯预测性别(上)

慕函数0552834

2021-12-02

请教老师 这些都是离线的 存在延迟,如果要实时的 这个思路是怎么样的?

写回答

1回答

小简同学

2021-12-04

同学你好,实时的思路是,实时收集的数据通过kafka,进入到flink,进行实时处理,可以借助Hbase+redis作为实时的维度表,HBase依然作为标签的落地存储,es可以作为数据的检索,redis作为检索数据的缓存。祝学习愉快

0
0

Spark+ES+ClickHouse 构建DMP用户画像

大数据主流技术,数据挖掘核心算法,用户画像完整知识轻松掌握

306 学习 · 219 问题

查看课程