spark sql 问题

来源:9-25 -数据清洗作业运行到YARN上

慕运维7479159

2018-04-11

tmp.createOrReplaceTempView("tmp")


tmp.foreachPartition(part => {
 part.foreach(info => {
   //选择比这个大的批次
   val Batch = info.getAs[String]("Batch")
   val tmp = spark.sql("select * from tmp")

   blacksRDD.toString()
   
 })
})

老师 有时候需要在 块中执行 sql 语句 而系统总是报 

Exception in thread "main" org.apache.spark.SparkException: Job aborted due to stage failure: Task 2 in stage 9.0 failed 1 times, most recent failure: Lost task 2.0 in stage 9.0 (TID 9, localhost, executor driver): java.lang.NullPointerException

这个错,

好像此时的 spark.sql 已经是 null 状态了, 怎样才能实现内部的sql语句功能

写回答

1回答

Michael_PK

2018-04-11

不太明白你这代码上下都在干啥。。。null很可能是取值的时候有问题,请加上适当的过滤条件把没必要的数据过滤掉

0
1
慕运维7479159
老师,使用广播参数解决问题
2018-04-12
共1条回复

以慕课网日志分析为例 进入大数据Spark SQL的世界

快速转型大数据:Hadoop,Hive,SparkSQL步步为赢

1644 学习 · 1129 问题

查看课程