spark rdd应用程序是以DAG的方式规划,spark sql中物理算子树是不是也是以DAG的方式运行?

来源:3-7 Spark SQL架构

程研板

2021-05-25

写回答

1回答

Michael_PK

2021-05-25

这个DAG指的是会把spark作业,按照宽依赖进行划分成不同的stage,然后组成DAG,在进行执行。

窄依赖的都在一个stage中,这样能以pipeline的方式执行,提升性能

0
0

SparkSQL入门 整合Kudu实现广告业务数据分析

大数据工程师干货课程 带你从入门到实战掌握SparkSQL

535 学习 · 192 问题

查看课程