wide & deep的column放置问题
来源:10-4 .代码实战wd模型之wide侧与deep侧特征构建

慕沐9623816
2019-01-03
请问特征到底是应该放在wide侧,还是应该放在deep侧,是如何确定呢?
看了网上的其他人讲解:
wide部分就是LR,LR的输入特征包括了离散特征和交叉特征;
deep侧,输入包括了连续的特征和 embedding特征
请问背后的原因是什么呢? 为啥离散放wide,连续放deep?
写回答
1回答
-
这个结合我在实战中的经验,我说一下我自己的理解,在最早浅层模型占工业界主导的时候,比如用lr时候,发现连续特征做离散化,离散特征做one hot。效果要远好于不做。因为占据的维度多了。你也发现了前面lr的课程,我们不管连续离散其实都是按照离散的方式 都处理成【0,1,0】类似这种向量的形式。所以在google 发表wd paper时候也说了wide 负责记忆,延续了lr的打法。我们只把连续值和 经过embeding colunm的离散值放入deep,试想如果我们不是放入embeding colum的话一个itemid 这个特征 在物料库几百万的系统里维度就是几百万 那么乘以隐层数目 第一层参数就太多了。 综上 我的理解是google之所以这么搞 是基于浅层延续的经验加实战可行性。
162019-01-03
相似问题