一个关于Python的问题

来源:1-3 关于本课程的编程环境

ALGO_cui

2017-12-20

波波老师,您好,到目前为止,我购买了您除了新出的机器学习的课程外所有的课程。非常感谢您的讲解,我受益匪浅。我想问个Python的问题,Python不支持多核运算,我之前在做一个kaggle的案例时,读写大数据和相关运算操作都比较慢。目前听说在scikit learn中的一些算法函数,比如随机森林,可以通过设置相关参数而达到多核处理的能力,这是真的吗?Python 既然不能像Java等语言那样使用多核,那在大数据分析领域里,除了他有很多现成的比较好的包外,到底他的长处在哪里?非常感谢!

写回答

2回答

liuyubobobo

2017-12-20

感谢你的支持:)


  1. 是真的。有n_jobs的参数,可以用于多核运算。我在我的课程中会举例说明这个参数的运用。

  2. 最重要的优点是快速建模,快速验证算法的准确性。因为机器学习算法的编写和传统算法不同。传统算法的目标很明确,完成相应的算法功能就可以。但是机器学习算法需要不断的调整数据,调试参数,变换方法,来逐步探索尝试地完成最终问题的解决方案。这本身就是解释形语言的优势,不会像编译型语言牵一发动全身,随便改一个参数就要全局重新编译;同时Python提供的一些列工具可以更方便快捷地完成这个过程,最典型的例子,在Jupyter Notebook中,我们只需要一次读取数据,之后就可以随时基于我们的数据进行试验。而如果在编译型语言中,我们稍微调整一下算法中最后一步,整个数据都要重新load,重新完成之后的每一个过程。使用Python及相应的开发工具,完全不需要担心这一点。

2
2
ALGO_cui
老师,忘了说了,您机器学习的课程已经购买了。
2017-12-26
共2条回复

ALGO_cui

提问者

2017-12-26

老师,忘了说了,您机器学习的课程已经购买了,不得不再赞一个!

0
1
liuyubobobo
感谢支持:)
2017-12-26
共1条回复

7个经典应用诠释Java算法精髓

课程重应用、重实践、重思维,真正应用于实际工作开发中

1888 学习 · 112 问题

查看课程