特征选取问题

来源:8-6 验证数据集与交叉验证

慕雪9580269

2021-04-21

波波老师好。

我有组数据,5种特征,每种特征维度不一,我应该如何处理比较适合?

1.对每种特征分别归一化先分别进行特征选择和降维后,再组合在一起进行分类
2.对所有特征分别归一化后一起进行特征选择和降维,再分类?

是不是两种都可以?

谢谢

写回答

2回答

慕雪9580269

提问者

2021-04-21

例如一共4种特征,第一种特征20维,第二种30维,第三种100维,第四种200维

我先对每种特征进行归一化,然后用特征选择算法(例如极端随机树等树模型)对每种特征中选取重要特征,选取后第一种特征还有18维,第二种还剩25维,第三种还剩55维,第四种还剩100维,最后再分别用PCA对其进行降维。降维后例如第一种特征还剩15维,第二种特征还剩20,第三种还剩40,第四种还剩60维。最后把他们组合再一起进行分类。

这样对吗?

0
1
liuyubobobo
我还是没有理解,什么叫第一种特征 20 维,第二种特征 30 维。你给我举一个具体的数据的例子,这个数据有两个特征,第一个特征 2 维,第二个特征 3 维?
2021-04-21
共1条回复

liuyubobobo

2021-04-21

抱歉,没有特别理解你的问题。


1)什么叫每种特征维度不一?


2)你说的“特征选择”具体是指什么?

0
0

Python3入门机器学习 经典算法与应用  

Python3+sklearn,兼顾原理、算法底层实现和框架使用。

5893 学习 · 2454 问题

查看课程