q估计值那里,老师你没讲明白为什么要这么做
来源:7-13 Deep Q Learning 实现迷宫游戏:决策算法(3)
Jerry_Lnj
2019-12-16
# 在 Q_eval_net 中,计算状态 s_j 的估计 Q 值
with tf.variable_scope('Q_eval'):
a_indices = tf.stack([tf.range(tf.shape(self.a)[0], dtype=tf.int32), self.a], axis=1)
# tf.gather_nd 用 indices 定义的形状来对 params 进行切片
self.q_eval_by_a = tf.gather_nd(params=self.q_eval, indices=a_indices)
这一部分没讲清楚
写回答
1回答
-
Oscar
2019-12-16
10
相似问题