随机森林怎么处理大数据

来源:13-5 随机森林和 Extra-Trees

慕妹7897946

2020-08-03

老师请问随机森林怎么处理大数据,比如20G左右的csv文本数据的机器学习或者深度学习。神经网络我是用的分批处理,但是随机森林不知道该怎么处理,没有找到相应的函数或者方法。

写回答

1回答

liuyubobobo

2020-08-04

所有的 scaled 的问题都属于相对“前沿”的问题。实际上,如果你能提供一套对所有机器学习算法都能很好的进行 scaled 的工具集,这套工具的价值是可以被苹果收购的级别。2016 年左右苹果收购的一家 AI 公司做的就是这件事儿。


对于随机森林,随便搜索了一下,这篇论文可能有帮助。以此为引,应该还能找到很多相关的文献或者解决方案:https://ai.ku.dk/news/large-scale-random-forests/


继续加油!:)

1
1
慕妹7897946
感谢老师,真是的很好地引导。
2020-08-04
共1条回复

Python3入门机器学习 经典算法与应用  

Python3+sklearn,兼顾原理、算法底层实现和框架使用。

5897 学习 · 2455 问题

查看课程