关于Partitioner和Shuffle的一些疑问
来源:4-17 流量统计实战升级之自定义Partitioner
某不入流码农
2020-06-23
1)感觉partitioner的职能好像和shuffle有些相似,但又不太一样,partitioner负责将数据按指定条件分区,shuffle负责将各个分区的数据copy到reduce端,这样理解是否正确?
2)partitioner和combiner都属于shuffle的一部分吗?
3)partitioner和combiner都是基于map的输出做的处理,都是在shuffle之前,这样说的正确吗?
以上问题稍有疑惑,烦请老师给点拨一下…
写回答
1回答
-
1)理解的是ok的。
2)其实shuffle可以这么理解:从map的输入到reducer的数据的过程都术语
3)准确的说是处于shuffle的前半阶段
112020-06-24
相似问题