wide & deep的column放置问题

来源:10-4 .代码实战wd模型之wide侧与deep侧特征构建

慕沐9623816

2019-01-03

请问特征到底是应该放在wide侧,还是应该放在deep侧,是如何确定呢?

看了网上的其他人讲解:
wide部分就是LR,LR的输入特征包括了离散特征和交叉特征;
deep侧,输入包括了连续的特征和 embedding特征

请问背后的原因是什么呢? 为啥离散放wide,连续放deep?

写回答

1回答

David

2019-01-03

这个结合我在实战中的经验,我说一下我自己的理解,在最早浅层模型占工业界主导的时候,比如用lr时候,发现连续特征做离散化,离散特征做one hot。效果要远好于不做。因为占据的维度多了。你也发现了前面lr的课程,我们不管连续离散其实都是按照离散的方式 都处理成【0,1,0】类似这种向量的形式。所以在google 发表wd paper时候也说了wide 负责记忆,延续了lr的打法。我们只把连续值和 经过embeding colunm的离散值放入deep,试想如果我们不是放入embeding colum的话一个itemid 这个特征 在物料库几百万的系统里维度就是几百万 那么乘以隐层数目 第一层参数就太多了。 综上 我的理解是google之所以这么搞 是基于浅层延续的经验加实战可行性。

1
6
David
回复
慕沐9623816
可以这样理解,user item embedding 相当于降维了。比在大规模lr时候放入的one hot更能浓缩信息,解决稀疏性。如果对以上的解答满意 学习完课程可以去评价一下课程。谢谢。
2019-01-03
共6条回复

个性化推荐算法实战(可用于毕设) BAT大牛亲授

让你掌握一套完整的,能落地的个性化推荐算法体系。可用于毕设。

839 学习 · 253 问题

查看课程