请问在HAN网络中那个u是怎么来的?

来源:7-4 基于LSTM的文本分类模型(TextRNN与HAN)

慕少0472972

2018-11-21

图片描述看到老师说加入Attention机制,用到了那个u,请问这个u是怎么来的,有什么意义,能具体解释一下吗,谢谢!

写回答

1回答

正十七

2018-11-25

u是参数,正如课程中所讲,这里的u起得作用类似于Lstm中的门限机制,用来控制alpha21, alpha22等的权重。

具体的,u是一个长度和alpha21, alpha22, ... 等长度相等的向量,在计算中可以是这样的过程:

  1. alpha21和u做内积,得到数值A21

  2. A21经过sigmoid函数,得到一个0-1之间的数A21_

  3. 对alpha22, alpha23, ... 做同样的操作,得到A22_, A23_, ...

  4. 那么对于一个经过attention之后的编码就是 A21_ * alpha21 + A22_ * alpha22 + ...

0
0

深度学习之神经网络(CNN/RNN/GAN)算法原理+实战

深度学习算法工程师必学,深入理解深度学习核心算法CNN RNN GAN

2617 学习 · 935 问题

查看课程