老师 ,请问maze类中的self.n_features为什么是2 ??

来源:7-14 Deep Q Learning 实现迷宫游戏:决策算法(4)和主程序

wxz123

2019-02-23

老师 ,请问maze类中的self.n_features为什么是2 ??

写回答

1回答

Oscar

2019-03-07

# 探索者在环境中实施这个 action, 并得到环境返回的下一个 state, reward 和 done (是否是踩到炸弹或者找到宝藏)
state_, reward, done = env.step(action)

n_feature 是 2 因为要么是踩到炸弹游戏结束(失败),要么是踩到宝藏游戏结束(胜利)。

0
0

基于Python玩转人工智能最火框架 TensorFlow应用实践

机器学习入门,打牢TensorFlow框架应用是关键!

2214 学习 · 688 问题

查看课程