感觉如果验证数据叫测试数据,测试数据叫验证数据是不是更好些?
来源:8-6 验证数据集与交叉验证

神经旷野舞者
2018-03-06
这样子的话,train_test_validation_split和之前的train_test_split前面部分就吻合了,而且也说的通,validation数据集就是用来验证train_test_split方案是否正确的嘛,不知道当初把validation放在测试前面是怎么考虑的,这样一来测试数据作用和原来方案的测试数据作用就不是一回事了?
写回答
1回答
-
是的,在使用验证数据集的情况下的测试数据集和不使用验证数据集情况下的测试数据集,不是一回事。
我觉得你对验证数据集的作用理解的有偏差。验证数据集的作用不是“验证train_test_split方案是否正确”,而是看在一组超参数县,训练数据集训练出的模型的效果是怎样的。如果不够好,换组超参数重新训练,直到达到理想的情况(或者虽然不理想,但是是可以得到的最佳模型)。最终,测试数据集的作用是判定我们的模型最终的效果是怎样的。所以,验证数据集是在测试数据集之前进行使用的。
简而言之:训练数据集的作用是做训练;验证数据集的作用是调超参;测试数据集的意义是评判训练的模型的最终结果。再重新听一遍这一小节的前半部分,理解一下这个过程?
112018-03-07
相似问题