为什么提交到YARN上面运行,存储到HDFS里面是两个文件呢?
来源:2-17 YARN模式下提交Spark应用程序

某不入流码农
2020-07-13
为什么这里使用YARN运行模式,最终结果输出在两个文件中呢?很迷惑,请老师解释一下
写回答
1回答
-
Michael_PK
2020-07-13
生产上spark绝大部分都是跑yarn的,统一资源管理。最终输出文件数是由partition或者task个数决定的
022020-07-13
相似问题
为什么提交到YARN上面运行,存储到HDFS里面是两个文件呢?
来源:2-17 YARN模式下提交Spark应用程序
某不入流码农
2020-07-13
为什么这里使用YARN运行模式,最终结果输出在两个文件中呢?很迷惑,请老师解释一下
1回答
Michael_PK
2020-07-13
生产上spark绝大部分都是跑yarn的,统一资源管理。最终输出文件数是由partition或者task个数决定的
相似问题