关于decoder输入
来源:10-11 Transformer模型总体架构
manbaneverout
2020-05-07
老师您好,这里decoder的输入就是上一步翻译出的单词吗,第一个输入是NULL?谢谢
写回答
1回答
-
decoder的输入是目标语言已有的所有词语和encoder的输出。第一个输入是<bos>,即begin of sentence.
然后,第一步是基于encoder的输出和<bos>做attention,预测第一个词A,然后是encoder的输出和<bos> A去做attention,去预测第二个词B。以此类推。
00
相似问题