pass

来源:3-12 tf.GradientTape与tf.keras结合使用

战战的坚果

2020-04-29

在超参数搜索完之后,会在全部训练集上用新的参数再训练一遍,老师他用的参数是从
param_distribution = {
“hidden_layers”:[1, 2, 3, 4],
“layer_size”: [5, 10, 20, 30],
“learning_rate”: [1e-4, 5e-5, 1e-3, 5e-3, 1e-2],}
这里sample出的10个中的最好的一组对吗?它是怎么选择出来的呢?,跟前边的model_checkpoint有什么关系吗?,它是保存最好的模型。

写回答

1回答

正十七

2020-04-29

对,最好的一个,选择就是按照它在训练集(11610样本)内切分出来的验证集(3870样本)上的val_loss.

跟前边的model_checkpoint没有关系,是从头开始训练的。

0
0

Google老师亲授 TensorFlow2.0 入门到进阶

Tensorflow2.0实战—以实战促理论的方式学习深度学习

1849 学习 · 896 问题

查看课程

相似问题

pass

回答 1

pass

回答 1

pass

回答 1

pass

回答 1

pass

回答 1