model.reset_states()

来源:7-8 文本生成实战之采样生成文本

wxz123

2019-12-28

老师

model.reset_states()

这句为什么只在预测中使用,而没有在训练步骤中使用呢

写回答

1回答

正十七

2020-01-02

这是因为在训练中,我们每次输入的样本都已经是序列了,所以训练时状态会每个序列开始的状态都是初始状态。而在预测的时候,我们是单步运行的,所以需要手动进行reset_states。

1
1
慕标9016513
请教老师,如果不reset_states,加载的model的初始状态是训练时的最后状态吗? 另外在训练的时候,每输入一个batch的数据进入RNN时,初始状态都是全0向量吗?
2022-02-17
共1条回复

Google老师亲授 TensorFlow2.0 入门到进阶

Tensorflow2.0实战—以实战促理论的方式学习深度学习

1849 学习 · 896 问题

查看课程