关于特征选取

来源:11-8 RBF核函数中的gamma

慕设计1002876

2020-06-06

老师,如果我使用Svm算法,选取了一篮子特征,肯定有的特征区分度强,有的区分度弱,那我有没有必要用遗传算法之类的工具,删去低效率的特征呢?或者说我保留低效的特征会不会显著降低我的分类效果?

写回答

1回答

liuyubobobo

2020-06-07

如果能够删除低效特征,还是建议做的。


这里的关键,其实不完全是低效特征的“低效”。如果抛开性能问题不谈,这要是特征太多,会导致数据维数过大,导致维度灾难。维度灾难会使得分类效果显著下降。解决方案是:增大数据量。维度越高,为了避免维度灾难,就需要越大的数据量。但是大多数时候,我们很难有无穷的数据量。


也正是因为如此,特征工程在机器学习算法的实践中是非常重要的。当然,特征工程不仅仅是删除“低效特征”,也旨在挖掘“更高效”的特征。关于特征工程更多讨论,可以参考这里:http://coding.imooc.com/learn/questiondetail/40722.html


继续加油!:)


0
4
慕设计1002876
回复
liuyubobobo
噢,看来确实模型有问题
2020-06-07
共4条回复

Python3入门机器学习 经典算法与应用  

Python3+sklearn,兼顾原理、算法底层实现和框架使用。

5839 学习 · 2437 问题

查看课程