为啥效果和老师说的不一样

来源:9-8 模型在测试数据集表现 上

慕仔6521860

2019-04-17

老师,我用工作中实际的数据跑了xgb、gbdt+lr、和wd模型,结果是gbdt+lr与xgb差别不大,AUC大概0.8,而满心期待的wd模型效果最差,只有0.61,变量有一百一十个,样本量有100w左右,实在不明白其中的原因,结果差这么大。

写回答

1回答

David

2019-04-17

wd 说明你选特征 和特征的feature transform 没做好,仔细看看 课程中对不同数据类型是咋处理的。

0
1
慕仔6521860
我的数据集大多数都是连续的,有六七个0,1的变量,连续的我都这样处理:login_diff = tf.contrib.layers.real_valued_column("login_diff") 然后选了几个连续特征buckets:all_pv_daily_15_buckets = tf.contrib.layers.bucketized_column( all_pv_daily_15, boundaries = [0,0.000001,0.1,0.5,1,5,10,50,100,500] )其他也没做啥操作了,把离散的特征放wide,连续放在deep层,老师我能发5万的样本集和跑数脚本,帮我看下吗?感觉不应该啊~~
2019-04-18
共1条回复

个性化推荐算法实战(可用于毕设) BAT大牛亲授

让你掌握一套完整的,能落地的个性化推荐算法体系。可用于毕设。

839 学习 · 253 问题

查看课程