请教简老师,特征交叉和特征筛选是同时进行的吗?

来源:4-16 Spark实现基于Xgboost的特征筛选(下)

Yu2j

2021-12-26

1.特征交叉和特征筛选有先后顺序吗?
2.对于用户的行为特征来说,在什么情况下需要进行特征交叉和特征筛选呢?
3.在本项目的应用过程中,是在特征交叉和特征筛选结束后,将特征存储到hive中吗?具体是哪张表呢?

写回答

1回答

小简同学

2021-12-28

同学你好,特征交叉和特征筛选没有很明确的先后顺序。通常整个流程是这样,需要预测的问题->模型选择->根据模型对数据进行标准化等的处理->跑模型->根据评估指标优化模型参数or 筛选特征 or 继续找特征(特征组合)->循环前面步骤。 在基础特征上找到合适的特征那最好,没有就进行特征组合。本课程由于选择的数据有很大的局限性,所以特征筛选和特征组合只是介绍了理论,没有运用到项目中。祝学习愉快!

0
1
Yu2j
非常感谢!
2021-12-28
共1条回复

Spark+ES+ClickHouse 构建DMP用户画像

大数据主流技术,数据挖掘核心算法,用户画像完整知识轻松掌握

306 学习 · 219 问题

查看课程