q估计值那里，老师你没讲明白为什么要这么做

来源：7-13 Deep Q Learning 实现迷宫游戏：决策算法（3）

Jerry_Lnj

2019-12-16

# 在 Q_eval_net 中，计算状态 s_j 的估计 Q 值

with tf.variable_scope('Q_eval'):

a_indices = tf.stack([tf.range(tf.shape(self.a)[0], dtype=tf.int32), self.a], axis=1)

# tf.gather_nd 用 indices 定义的形状来对 params 进行切片

self.q_eval_by_a = tf.gather_nd(params=self.q_eval, indices=a_indices)

这一部分没讲清楚

写回答

1回答

Oscar

2019-12-16

基于Python玩转人工智能最火框架 TensorFlow应用实践

机器学习入门，打牢TensorFlow框架应用是关键！

2214 学习 · 688 问题

相似问题

回答 1

回答 1

回答 1

回答 2

回答 1