关于 executor 和 driver 的问题

来源:5-1 -课程目录

pain7

2020-09-09

我看到老师的笔记里面有提到,action 动作触发之后,会进行计算并返回数据。那我有两个问题啊
首先,这个数据是从 executor 返回到 driver 里面的吗
然后,这个是所有 executor 的数据返回到 driver 里面的吗,如果数据量大的话,会不会 OOM,有什么避免方法吗?比如说我要从 dataset 遍历取出数据进行操作的话

写回答

1回答

Michael_PK

2020-09-09

你要是所有东西都返回而且数据量大肯定oom。问题是你觉得在工作中是否计算结果都要返回的呢?不是的吧,肯定是结果写到某个地方去了,这不用返回呢

0
0

Python3实战Spark大数据分析及调度

使用Python3对Spark应用程序进行开发调优,掌握Azkaban任务调度

1046 学习 · 434 问题

查看课程