./dev/make-distribution.sh 特别慢

来源:3-2 -Spark源码编译

zzLai

2019-01-31

使用 $ ./build/mvn -Pyarn -Phive -Phive-thriftserver -Phadoop-2.6 -Dhadoop.version=2.6.0-cdh5.7.0 -DskipTests clean package 命令编译时只需要16~20分钟就能完成编译

使用 $ ./dev/make-distribution.sh --name 2.6.0-cdh5.7.0 --tgz -Pyarn -Phive -Phive-thriftserver -Phadoop-2.6 -Dhadoop.version=2.6.0-cdh5.7.0 花了5小时还是停留在这个位置

[INFO] Dependency-reduced POM written at: /home/hadoop/download/spark-2.4.0/mllib-local/dependency-reduced-pom.xml
[INFO] 
[INFO] --- maven-source-plugin:3.0.1:jar-no-fork (create-source-jar) @ spark-mllib-local_2.11 ---
[INFO] Building jar: /home/hadoop/download/spark-2.4.0/mllib-local/target/spark-mllib-local_2.11-2.4.0-sources.jar
[INFO] 
[INFO] --- maven-source-plugin:3.0.1:test-jar-no-fork (create-source-jar) @ spark-mllib-local_2.11 ---
[INFO] Building jar: /home/hadoop/download/spark-2.4.0/mllib-local/target/spark-mllib-local_2.11-2.4.0-test-sources.jar

vm是4核4G内存,在这一步hadoop被开启了而且cpu占用率在300%浮动一直持续。
想知道这个是不是正常情况?

写回答

1回答

Michael_PK

2019-01-31

首先make那个命令底层就是mvn那个,只是打包了而已。其次你确认啥cpu飙是哪个进程导致的。再次首次编译spark的时间有时候会非常长,这取决于网络原因

0
4
Michael_PK
回复
zzLai
不打包没法部署,后面的没法用。官网上的不知道是否和你的hadoop版本冲突。你去群里让其他人丢一个安装包给你不就行了。。
2019-01-31
共4条回复

以慕课网日志分析为例 进入大数据Spark SQL的世界

快速转型大数据:Hadoop,Hive,SparkSQL步步为赢

1644 学习 · 1129 问题

查看课程