updateStateByKey的时候设置checkpoint的作用?
来源:8-2 -实战之updateStateByKey算子的使用

啾啾8
2017-11-12
updateStateByKey的时候需要设置checkpoint的目录,课程中说是为了存放旧的的值,我觉得是因为要定期去做checkpoint而不是去存放旧的值,旧的值还是存在内存中的吧,checkpoint的作用是防止数据丢失重新去计算DAG中的每一步;如果每次计算都要做checkpoint会不会影响计算速度?而且checkpoint之后之前的依赖关系也销毁,这样可以释放资源;所以我认为checkpoint说是为了存放旧的值的说法不正确
写回答
1回答
-
Michael_PK
2017-11-12
你这说的是一部分。你想一个问题,所有的旧值都只存放内存?你的内存不会被爆?因为7*24小时不停的流处理
00
相似问题