老师,一个 parition 一个 task,那是不是说有几个 partition 就有几个线程处理呢

来源:3-6 -图解RDD

pain7

2020-09-06

写回答

1回答

Michael_PK

2020-09-06

可以这么理解的,spark里面其实就是一个rdd
有几个partition就是对应的task数量

0
1
pain7
那一个 task 是一个线程吗,是不是说默认 200 个 partition,那么就有 200 个 task
2020-09-06
共1条回复

Python3实战Spark大数据分析及调度

使用Python3对Spark应用程序进行开发调优,掌握Azkaban任务调度

1046 学习 · 434 问题

查看课程