老师 ,请问maze类中的self.n_features为什么是2 ??
来源:7-14 Deep Q Learning 实现迷宫游戏:决策算法(4)和主程序

wxz123
2019-02-23
老师 ,请问maze类中的self.n_features为什么是2 ??
写回答
1回答
-
Oscar
2019-03-07
# 探索者在环境中实施这个 action, 并得到环境返回的下一个 state, reward 和 done (是否是踩到炸弹或者找到宝藏) state_, reward, done = env.step(action)
n_feature 是 2 因为要么是踩到炸弹游戏结束(失败),要么是踩到宝藏游戏结束(胜利)。
00
相似问题