老师，请问maze类中的self.n_features为什么是2 ？？

来源：7-14 Deep Q Learning 实现迷宫游戏：决策算法(4)和主程序

wxz123

2019-02-23

写回答

1回答

Oscar

2019-03-07

# 探索者在环境中实施这个 action, 并得到环境返回的下一个 state, reward 和 done (是否是踩到炸弹或者找到宝藏)
state_, reward, done = env.step(action)

n_feature 是 2 因为要么是踩到炸弹游戏结束（失败），要么是踩到宝藏游戏结束（胜利）。

基于Python玩转人工智能最火框架 TensorFlow应用实践

机器学习入门，打牢TensorFlow框架应用是关键！

2214 学习 · 688 问题

相似问题

回答 2

回答 3

回答 2

回答 1

回答 3