Analysis of Hyper-Parameters for AlphaZero-Like Deep Reinforcement Learning

Hui Wang, Michael Emmerich, Mike Preuss, Aske Plaat

Published: 2023, Last Modified: 17 May 2023Int. J. Inf. Technol. Decis. Mak. 2023Readers: Everyone

Abstract: The landmark achievements of AlphaGo Zero have created great research interest into self-play in reinforcement learning. In self-play, Monte Carlo Tree Search (MCTS) is used to train a deep neural ...

0 Replies