正负样本失衡问题
来源:8-8 LR模型在测试数据集上表现-上

慕码人1088981
2019-03-17
在真实情况下,通常点击的样本要比没点击的样本小的多。如果通过采样的方式使得正负样本均衡。那么对于破坏掉了样本原来的比例这个问题有什么办法吗?还是说破坏掉原来样本的比例也并不影响最终的预测结果?
写回答
1回答
-
通常情况下按实际生产环境正常的正负样本比例即可。只有在大规模多分类(比如100w个类)这种极特殊case 需要保证每个类样本数均衡。
012019-03-17
相似问题