特征随机采样

来源:13-4 oob (Out-of-Bag) 和关于Bagging的更多讨论

wxz123

2019-08-29

老师,在bagging中,对特征进行采样, 比如每个样本有3个特征,采用max_features=1, bootstrap_features=True,max_samples=100,n_estimators=500,bootstrap=True的话,则对于每棵树来说,随机取到的100个样本的特征维度是否应该一致呢(比如同一棵树取得特征都是第一个特征)?
在下面个图中对于不同的样本,特征的维度取得也不一样,用这样一组样本该如何去训练一颗决策树呢?
图片描述

写回答

1回答

liuyubobobo

2019-08-29

我听了一下,我在课程中的叙述不准确。


对于 random patches,每一棵决策树(或者每一个子分类器)所处理的特征是一致的,即每一棵决策树(或者每一个子分类器)是针对一组随机采样的数据的一组随机采样的特征进行训练的。


所以,在这个图中,每行代表一个决策树,每列代表特征。每棵决策树选用的数据特征不同,但在一颗决策树内部,是一组共同的特征。


抱歉!


继续加油!:)

2
1
wxz123
非常感谢!
2019-08-29
共1条回复

Python3入门机器学习 经典算法与应用  

Python3+sklearn,兼顾原理、算法底层实现和框架使用。

5893 学习 · 2454 问题

查看课程