请问为什么需要先做数据拆分,然后再归一化?
来源:2-7 实战回归模型
慕桂英5168734
2020-02-28
问题1 :请问为什么需要先做数据拆分,然后再做归一化,不能先统一归一化,再数据拆分吗?
问题2 :为什么训练集使用fit_transform, 测试和验证集使用transform,而不是都用fit_transform或者都用transform?
写回答
1回答
-
正十七
2020-03-01
问题1:如果训练街和测试集都在你手里的话,那么可以这么做。但是一般的生产环境中,你只有训练集,没有测试集,所以要在训练集上算出来均值和方差,然后用这个均值和方差去处理测试集和验证集。
问题2:fit_transform,是计算均值和方差同时做归一化,fit_transform是用给定的均值和方差去做处理。
00
相似问题