sparkContext.textFile找不到路径
来源:9-6 数据清洗之第一步原始日志解析
jeff没有时间简史
2019-01-27
val spark = SparkSession.builder().appName(“SparkStatFormatJob”)
.master(“local[2]”).getOrCreate()
val acccess = spark.sparkContext.textFile("file:///D://mook_spark//11.11 log//199//access.20161111.log//access.20161111")
//acccess.take(10).foreach(println)
acccess.map(line => {
val splits = line.split(" ")
val ip = splits(0)
/**
* 原始日志的第三个和第四个字段拼接起来就是完整的访问时间:
* [10/Nov/2016:00:01:02 +0800] ==> yyyy-MM-dd HH:mm:ss
*/
val time = splits(3) + " " + splits(4)
val url = splits(11).replaceAll("\"","")
val traffic = splits(9)
// (ip, DateUtils.parse(time), url, traffic)
DateUtils.parse(time) + "\t" + url + "\t" + traffic + "\t" + ip
}).saveAsTextFile("file:///D:/output2/")
spark.stop()
}
写回答
2回答
-
Michael_PK
2019-01-27
最起码的文件夹命名也注意下吧。。。
022019-01-27 -
Michael_PK
2019-01-27
你把那个路径拷贝出来到你系统上看看有吗?
00
相似问题