关于combine的问题

来源:10-6 Decoder构建

qq_雨后天晴_0

2020-01-07

老师,这里为什么要将emdeding后的x和context_vector连接后输入GRU而不是直接把context_vector作为GRU的输入呢??

写回答

1回答

正十七

2020-01-09

同学你好,这个问题针对的是seq2seq + attention模型吧。

在这里,因为context_vector是原语言信息,而x是目标语言上一步的信息,在decoder的lstm中,还有隐含状态是目标语言的已经翻译出来词语的信息。

综上,这里把context vector和x拼起来再输入的原因是decoder在这一步不仅需要知道源语言的信息,还需要知道什么信息已经翻译出来了。

0
1
qq_雨后天晴_0
非常感谢!
2020-01-17
共1条回复

Google老师亲授 TensorFlow2.0 入门到进阶

Tensorflow2.0实战—以实战促理论的方式学习深度学习

1849 学习 · 896 问题

查看课程