关于shuffle的理解问题

来源:4-17 流量统计实战升级之自定义Partitioner

慕九州8702158

2020-08-04

老师,您之前有说partitioner和combiner属于shuffle前半段
是不是数据map之后先是经过combiner之后通过getpartition得到自己的分区号然后输入到各自的分区,然后在每个分区中各自按照key值shuffle,然后再reduce

写回答

1回答

Michael_PK

2020-08-04

combiner和partition谁先走,我建议你debug走下,谁先谁后就更深印象了

0
1
慕九州8702158
非常感谢!
2020-08-04
共1条回复

Hadoop 系统入门+核心精讲

从Hadoop核心技术入手,掌握数据处理中ETL应用,轻松进军大数据

2397 学习 · 902 问题

查看课程