正负样本失衡问题

来源:8-8 LR模型在测试数据集上表现-上

慕码人1088981

2019-03-17

在真实情况下,通常点击的样本要比没点击的样本小的多。如果通过采样的方式使得正负样本均衡。那么对于破坏掉了样本原来的比例这个问题有什么办法吗?还是说破坏掉原来样本的比例也并不影响最终的预测结果?

写回答

1回答

David

2019-03-17

通常情况下按实际生产环境正常的正负样本比例即可。只有在大规模多分类(比如100w个类)这种极特殊case 需要保证每个类样本数均衡。

0
1
慕码人1088981
非常感谢!
2019-03-17
共1条回复

个性化推荐算法实战(可用于毕设) BAT大牛亲授

让你掌握一套完整的,能落地的个性化推荐算法体系。可用于毕设。

839 学习 · 253 问题

查看课程