请问在HAN网络中那个u是怎么来的?
来源:7-4 基于LSTM的文本分类模型(TextRNN与HAN)
慕少0472972
2018-11-21
看到老师说加入Attention机制,用到了那个u,请问这个u是怎么来的,有什么意义,能具体解释一下吗,谢谢!
写回答
1回答
-
正十七
2018-11-25
u是参数,正如课程中所讲,这里的u起得作用类似于Lstm中的门限机制,用来控制alpha21, alpha22等的权重。
具体的,u是一个长度和alpha21, alpha22, ... 等长度相等的向量,在计算中可以是这样的过程:
alpha21和u做内积,得到数值A21
A21经过sigmoid函数,得到一个0-1之间的数A21_
对alpha22, alpha23, ... 做同样的操作,得到A22_, A23_, ...
那么对于一个经过attention之后的编码就是 A21_ * alpha21 + A22_ * alpha22 + ...
00
相似问题