key=1没看懂代表啥意思,代表文件还是目录?还是规定写法?

来源:8-5 -E SparkSQL愿景之一写更少的代码(Schema Merge)

少帅521

2018-07-25

写回答

2回答

慕桂英1146026

2018-12-03

可以写成:
key=1 ...key=n 或者 a=1 ... a=n

key 不变 ,value累加(value可以是字符串,但是不能相同)

1
0

Michael_PK

2018-07-25

先了解下分区表的分区字段表达方式就明白了

0
1
慕桂英1146026
这种方式是不是可以理解为:数据量很大的情况下,将一张表(如30个字段,前10个,中间10,后10个字段分别放在了三个文件(也可以理解为数据的三张表)),操作的时候进行合并,然后在进行后续的操作。 我突然想到一个问题:三张表在同一个数据库还好,在不同的数据库或者机房,这种网络开销岂不是要废了,还是根本就不存在这种情况(只能在共享的上一级父目录)
2018-12-03
共1条回复

以慕课网日志分析为例 进入大数据Spark SQL的世界

快速转型大数据:Hadoop,Hive,SparkSQL步步为赢

1644 学习 · 1129 问题

查看课程