位置编码信息
来源:10-13 多头注意力与位置编码
qq_慕前端4252840
2021-08-02
老师,感觉好像做位置编码是仅仅针对一个词本身而言,对于词与词之间的相对位置顺序好像没有做编码啊,那在并行的情况下,怎么能知道哪个词在前面,哪个词在后面呢?这里感觉好绕啊。还是说每一个词的位置编码是一个长度为句子长度的稀疏向量,对应位置才有数值,其他的位置都是0?
写回答
1回答
-
在这里,位置编码的作用是给每一个位置独特的编码,而不是特意的强调前后顺序。
在并行的情况下,我们有lookahead mask来做处理,即对某个位置做预测的时候,会把这个位置之后的input给mask掉,这样后面的数据就不会影响当前位置的预测了。
位置表吗不是one-hot编码,每个位置编码都是独特的。在我们的课程里,位置编码是固定的,而在一些变种里,位置编码是可学习的。
012021-08-07
相似问题