tf.matmul(q,k) 是怎么设定只做最后两个维度乘法的

来源:10-18 缩放点积注意力机制实现(1)

刘鹏4

2021-09-22

tf.matmul(q,k)  是怎么设定只做最后两个维度乘法的,是不是无论是几个维度的矩阵,这个方法都是只乘最后两位?

写回答

1回答

正十七

2021-09-25

从函数的定义的解释上看是的,后两个维度做矩阵计算,前面的维度会被当作batch_size, 而且必须得一样才可以。

https://www.tensorflow.org/api_docs/python/tf/linalg/matmul


1
1
刘鹏4
谢谢您的赐教
2021-09-26
共1条回复

Google老师亲授 TensorFlow2.0 入门到进阶

Tensorflow2.0实战—以实战促理论的方式学习深度学习

1849 学习 · 896 问题

查看课程