encoder的输入问题
来源:10-7 损失函数与单步训练函数
慕移动4519168
2020-01-20
老师有个问题请教,decoder的输入我的理解应该是decoder前一时刻的输出,怎么会有target做为输入呢?decoder就是为了解出target,如果反而有这个信息做为输入那不是没有意义了吗?
写回答
1回答
-
我们在预测的时候确实是如你所说要用上一步的输出作为下一步的输入。
但是在训练的时候,用的是target的值。这样做的目的是:
a. 容易收敛,对于每一步来说,之前的输入全都是正确的,这样减少的搜索空间,更容易收敛。
b. 这样,我们可以让样本的输入和输出变成[a,b,c,d,e...] 和[b,c,d,e,f,...],从而将训练批量进行,可以更快。
00
相似问题