特征随机采样
来源:13-4 oob (Out-of-Bag) 和关于Bagging的更多讨论

wxz123
2019-08-29
老师,在bagging中,对特征进行采样, 比如每个样本有3个特征,采用max_features=1, bootstrap_features=True,max_samples=100,n_estimators=500,bootstrap=True的话,则对于每棵树来说,随机取到的100个样本的特征维度是否应该一致呢(比如同一棵树取得特征都是第一个特征)?
在下面个图中对于不同的样本,特征的维度取得也不一样,用这样一组样本该如何去训练一颗决策树呢?
写回答
1回答
-
我听了一下,我在课程中的叙述不准确。
对于 random patches,每一棵决策树(或者每一个子分类器)所处理的特征是一致的,即每一棵决策树(或者每一个子分类器)是针对一组随机采样的数据的一组随机采样的特征进行训练的。
所以,在这个图中,每行代表一个决策树,每列代表特征。每棵决策树选用的数据特征不同,但在一颗决策树内部,是一组共同的特征。
抱歉!
继续加油!:)
212019-08-29
相似问题