关于decoder输入

来源:10-11 Transformer模型总体架构

manbaneverout

2020-05-07

老师您好,这里decoder的输入就是上一步翻译出的单词吗,第一个输入是NULL?谢谢

写回答

1回答

正十七

2020-05-07

decoder的输入是目标语言已有的所有词语和encoder的输出。第一个输入是<bos>,即begin of sentence.

然后,第一步是基于encoder的输出和<bos>做attention,预测第一个词A,然后是encoder的输出和<bos> A去做attention,去预测第二个词B。以此类推。


0
0

Google老师亲授 TensorFlow2.0 入门到进阶

Tensorflow2.0实战—以实战促理论的方式学习深度学习

1849 学习 · 896 问题

查看课程