老师,header,true导入数据后,数据表好像乱了,麻烦看看,谢谢~

来源:13-8 -数据加载成DataFrame并选出需要的列

慕勒1019045

2018-09-30

df = spark.read.format(“csv”).option(“header”,“true”).load(“file:///home/hadoop/data/Beijing_2017_HourlyPM25_created20170803.csv”)

图片描述

写回答

1回答

Michael_PK

2018-09-30

你检查下原始文件是否正确,编码方式啥的,切记一点,下载下来后千万不能使用excel打开,特别是win系统,会有问题

0
2
Michael_PK
回复
慕勒1019045
我记得CSV下载后头上是不是有些多余的东西的,需要手工去掉
2018-09-30
共2条回复

Python3实战Spark大数据分析及调度

使用Python3对Spark应用程序进行开发调优,掌握Azkaban任务调度

1046 学习 · 434 问题

查看课程