q估计值那里,老师你没讲明白为什么要这么做

来源:7-13 Deep Q Learning 实现迷宫游戏:决策算法(3)

Jerry_Lnj

2019-12-16


        # 在 Q_eval_net 中,计算状态 s_j 的估计 Q 值

        with tf.variable_scope('Q_eval'):

            a_indices = tf.stack([tf.range(tf.shape(self.a)[0], dtype=tf.int32), self.a], axis=1)

            # tf.gather_nd 用 indices 定义的形状来对 params 进行切片

            self.q_eval_by_a = tf.gather_nd(params=self.q_eval, indices=a_indices)


这一部分没讲清楚

写回答

1回答

Oscar

2019-12-16

请不要重复提问,谢谢。请见:https://coding.imooc.com/learn/questiondetail/157299.html

1
0

基于Python玩转人工智能最火框架 TensorFlow应用实践

机器学习入门,打牢TensorFlow框架应用是关键!

2214 学习 · 688 问题

查看课程