Spark MLlib不支持分布式计算吗老师?

来源:6-2 实战统计汇总

Panda_io

2020-09-21

老师breeze只支持单机,那么就失去了spark的优势(分布式计算),那么SparkMLlib只能支持单机计算吗?这样和Python做数据分析没啥区别了呀甚至单机操作还不如python,毕竟python还支持了可视化。

写回答

1回答

Wotchin

2020-09-24

这个问题问得很好,这个库本身是单机的,spark的分布式组件是在这上面的,因此并不影响spark的分布式功能。课程中的例子只是给大家一个形象的感觉,spark在ml算法的实现上已经完成了分布式的功能。你可以理解spark本身是一个并行计算的框架,这些都是框架上填充的部分,实际工程上,往往我们调用现成的算法,用不到这么底层的库

0
2
Panda_io
明白了,谢谢老师答疑解惑,受益良多
2020-09-24
共2条回复

掌握Spark机器学习库 大数据开发技能更进一步

案例+原理+代码 提升大数据处理能力

476 学习 · 81 问题

查看课程