请教简老师,特征交叉和特征筛选是同时进行的吗?
来源:4-16 Spark实现基于Xgboost的特征筛选(下)

Yu2j
2021-12-26
1.特征交叉和特征筛选有先后顺序吗?
2.对于用户的行为特征来说,在什么情况下需要进行特征交叉和特征筛选呢?
3.在本项目的应用过程中,是在特征交叉和特征筛选结束后,将特征存储到hive中吗?具体是哪张表呢?
写回答
1回答
-
同学你好,特征交叉和特征筛选没有很明确的先后顺序。通常整个流程是这样,需要预测的问题->模型选择->根据模型对数据进行标准化等的处理->跑模型->根据评估指标优化模型参数or 筛选特征 or 继续找特征(特征组合)->循环前面步骤。 在基础特征上找到合适的特征那最好,没有就进行特征组合。本课程由于选择的数据有很大的局限性,所以特征筛选和特征组合只是介绍了理论,没有运用到项目中。祝学习愉快!
012021-12-28
相似问题