sparkContext.textFile找不到路径

来源:9-6 数据清洗之第一步原始日志解析

jeff没有时间简史

2019-01-27

图片描述 val spark = SparkSession.builder().appName(“SparkStatFormatJob”)
.master(“local[2]”).getOrCreate()

val acccess = spark.sparkContext.textFile("file:///D://mook_spark//11.11 log//199//access.20161111.log//access.20161111")

//acccess.take(10).foreach(println)

acccess.map(line => {
  val splits = line.split(" ")
  val ip = splits(0)

  /**
    * 原始日志的第三个和第四个字段拼接起来就是完整的访问时间:
    * [10/Nov/2016:00:01:02 +0800] ==> yyyy-MM-dd HH:mm:ss
    */
  val time = splits(3) + " " + splits(4)
  val url = splits(11).replaceAll("\"","")
  val traffic = splits(9)
  //      (ip, DateUtils.parse(time), url, traffic)
  DateUtils.parse(time) + "\t" + url + "\t" + traffic + "\t" + ip
}).saveAsTextFile("file:///D:/output2/")

spark.stop()

}

写回答

2回答

Michael_PK

2019-01-27

最起码的文件夹命名也注意下吧。。。

0
2
Michael_PK
回复
jeff没有时间简史
你这写的路径和控制台输出是一样吗?文件夹命名建议正规点,还有空格吗?
2019-01-27
共2条回复

Michael_PK

2019-01-27

你把那个路径拷贝出来到你系统上看看有吗?

0
0

以慕课网日志分析为例 进入大数据Spark SQL的世界

快速转型大数据:Hadoop,Hive,SparkSQL步步为赢

1644 学习 · 1129 问题

查看课程