Spark MLlib不支持分布式计算吗老师?
来源:6-2 实战统计汇总
Panda_io
2020-09-21
老师breeze只支持单机,那么就失去了spark的优势(分布式计算),那么SparkMLlib只能支持单机计算吗?这样和Python做数据分析没啥区别了呀甚至单机操作还不如python,毕竟python还支持了可视化。
写回答
1回答
-
这个问题问得很好,这个库本身是单机的,spark的分布式组件是在这上面的,因此并不影响spark的分布式功能。课程中的例子只是给大家一个形象的感觉,spark在ml算法的实现上已经完成了分布式的功能。你可以理解spark本身是一个并行计算的框架,这些都是框架上填充的部分,实际工程上,往往我们调用现成的算法,用不到这么底层的库
022020-09-24
相似问题