关于lstm中门的运算
来源:7-17 LSTM单元内部结构实现
紫梦沁香
2021-08-05
课程中是将x和h分别乘以不同的W然后相加
而我在网上看到了另一种做法,先将x和h给stack到一起,然后统一用一个大的W来matmul
结果应该都是[batch_size,num_lstm_nodes[-1]]
这两种方法应该是等价的吧,运算速度会不会第二种方法更快点呢?毕竟只要做一次matmul
写回答
1回答
-
对,结果是等价的。
然后在GPU上应该是能够加速的,因为大矩阵的乘法运算是并行的。在CPU上估计没有提速。
00