关于lstm中门的运算

来源:7-17 LSTM单元内部结构实现

紫梦沁香

2021-08-05

课程中是将x和h分别乘以不同的W然后相加
而我在网上看到了另一种做法,先将x和h给stack到一起,然后统一用一个大的W来matmul
结果应该都是[batch_size,num_lstm_nodes[-1]]
这两种方法应该是等价的吧,运算速度会不会第二种方法更快点呢?毕竟只要做一次matmul
图片描述
图片描述

写回答

1回答

正十七

2021-08-07

对,结果是等价的。

然后在GPU上应该是能够加速的,因为大矩阵的乘法运算是并行的。在CPU上估计没有提速。

0
0

深度学习之神经网络(CNN/RNN/GAN)算法原理+实战

深度学习算法工程师必学,深入理解深度学习核心算法CNN RNN GAN

2617 学习 · 935 问题

查看课程