Q-Learning-2

2019-11-02
强化学习

学习地址

Double DQN

Q value 通常会 over-estimated
2019-11-02 16-52-49 的屏幕截图.png

Dueling DQN

2019-11-02 16-57-28 的屏幕截图.png

Prioritized Reply

2019-11-02 17-04-03 的屏幕截图.png

Multi-step

2019-11-02 17-06-16 的屏幕截图.png

Noisy Net

2019-11-02 17-07-49 的屏幕截图.png

2019-11-02 17-11-21 的屏幕截图.png

Distributional Q-function

2019-11-02 17-18-54 的屏幕截图.png

分享
  • RL
  • 强化学习
上一篇
Q-Learning-3
下一篇
Q-Learning-1