请问老师关于提交到K8s
来源:5-2 -local模式运行
Panda_io
2021-11-12
问题(1)
如果提交到k8s上面,是不是就失去了移动计算的特性了呢,我的理解是提交到k8s处理的数据就要通过网络传输下载到Pod面(比如从HDFS上面下载数据)
问题(2)
既然是多个Pod同时并行计算,那么数据该如何进行分区呢,假设有三个Executor节点,HDFS上的文件有三个block是每个Executor只下载一个block吗?
问题(3)
假设问题(2)成立,那么每个pod具体下载哪一个block,是由哪个组件来进行分配调度的呢?
写回答
1回答
-
Michael_PK
2021-11-13
spark提交到k8s,只要运维的k8s部署好了之后,提交spark-submit时的master指定k8s就行了
--master MASTER_URL spark://host:port, mesos://host:port, yarn,
k8s://https://host:port, or local (Default: local[*]).
就是使用k8s开头的那个地址的写法就可以了
00
相似问题
将代码提交到yarn上运行
回答 1
关于 executor
回答 1