请问为什么需要先做数据拆分,然后再归一化?

来源:2-7 实战回归模型

慕桂英5168734

2020-02-28

问题1 :请问为什么需要先做数据拆分,然后再做归一化,不能先统一归一化,再数据拆分吗?

问题2 :为什么训练集使用fit_transform, 测试和验证集使用transform,而不是都用fit_transform或者都用transform?

写回答

1回答

正十七

2020-03-01

问题1:如果训练街和测试集都在你手里的话,那么可以这么做。但是一般的生产环境中,你只有训练集,没有测试集,所以要在训练集上算出来均值和方差,然后用这个均值和方差去处理测试集和验证集。

问题2:fit_transform,是计算均值和方差同时做归一化,fit_transform是用给定的均值和方差去做处理。

0
0

Google老师亲授 TensorFlow2.0 入门到进阶

Tensorflow2.0实战—以实战促理论的方式学习深度学习

1849 学习 · 896 问题

查看课程