并行度与 Shuffle
来源:4-12 流量统计实战之自定义复杂数据类型
qq_LU飞_0
2019-06-26
老师您好,map 阶段的输出的时候有可能会产生 多个文件,Shuffle 机制会将这多个文件合并为一个给 Reduce阶段使用么?是不是可以理解为 Reduce 阶段的入口文件永远只有一个
写回答
1回答
-
错的,reduce入口可能会有多个问题。因为map输出就可能是多个的
00
相似问题
并行度与 Shuffle
来源:4-12 流量统计实战之自定义复杂数据类型
qq_LU飞_0
2019-06-26
老师您好,map 阶段的输出的时候有可能会产生 多个文件,Shuffle 机制会将这多个文件合并为一个给 Reduce阶段使用么?是不是可以理解为 Reduce 阶段的入口文件永远只有一个
1回答
错的,reduce入口可能会有多个问题。因为map输出就可能是多个的
相似问题