一个关于Python的问题
来源:1-3 关于本课程的编程环境
ALGO_cui
2017-12-20
波波老师,您好,到目前为止,我购买了您除了新出的机器学习的课程外所有的课程。非常感谢您的讲解,我受益匪浅。我想问个Python的问题,Python不支持多核运算,我之前在做一个kaggle的案例时,读写大数据和相关运算操作都比较慢。目前听说在scikit learn中的一些算法函数,比如随机森林,可以通过设置相关参数而达到多核处理的能力,这是真的吗?Python 既然不能像Java等语言那样使用多核,那在大数据分析领域里,除了他有很多现成的比较好的包外,到底他的长处在哪里?非常感谢!
写回答
2回答
-
感谢你的支持:)
是真的。有n_jobs的参数,可以用于多核运算。我在我的课程中会举例说明这个参数的运用。
最重要的优点是快速建模,快速验证算法的准确性。因为机器学习算法的编写和传统算法不同。传统算法的目标很明确,完成相应的算法功能就可以。但是机器学习算法需要不断的调整数据,调试参数,变换方法,来逐步探索尝试地完成最终问题的解决方案。这本身就是解释形语言的优势,不会像编译型语言牵一发动全身,随便改一个参数就要全局重新编译;同时Python提供的一些列工具可以更方便快捷地完成这个过程,最典型的例子,在Jupyter Notebook中,我们只需要一次读取数据,之后就可以随时基于我们的数据进行试验。而如果在编译型语言中,我们稍微调整一下算法中最后一步,整个数据都要重新load,重新完成之后的每一个过程。使用Python及相应的开发工具,完全不需要担心这一点。
222017-12-26 -
ALGO_cui
提问者
2017-12-26
老师,忘了说了,您机器学习的课程已经购买了,不得不再赞一个!
012017-12-26
相似问题