请教老师 为啥要添加label 字段 ?这个label应该是自行定义的吧?

来源:4-15 Spark实现基于Xgboost的特征筛选(上)

慕函数0552834

2021-11-11

http://img.mukewang.com/szimg/618d1a9409b7ef5b12750230.jpg

请教老师 为啥要添加label 字段 ?这个label应该是自行定义的吧?

写回答

1回答

小简同学

2021-11-13

同学你好,xgboost是有监督的学习,需要人为的对样本打上标签,才能进行训练。这里的意思是将某种的用户行为打上对应的标签。因为机器根本不知道某个用户行为是代表什么意思,例如用户浏览某个商品的时间大于某个阙值,那么可以对这个浏览行为可以认为用户对商品是正面反馈的,可以用1来表示,这样子机器才能进行后面的算法训练。

0
0

Spark+ES+ClickHouse 构建DMP用户画像

大数据主流技术,数据挖掘核心算法,用户画像完整知识轻松掌握

306 学习 · 219 问题

查看课程