dataframe 有一个repartition方法可以传入一个数字,请问这个方法的效果和hdfs的分块,和压缩文件的切分(split)有什么联系吗?

来源:4-5 -Spark SQL愿景

小刚asdf

2018-06-22

写回答

1回答

Michael_PK

2018-06-22

这个参数的意思建议你打开源码看看方法的注释。它是将数据重新打散

0
3
小刚asdf
非常感谢 !
2018-06-22
共3条回复

以慕课网日志分析为例 进入大数据Spark SQL的世界

快速转型大数据:Hadoop,Hive,SparkSQL步步为赢

1644 学习 · 1129 问题

查看课程