Policy Gradient with Tree Search (PGTS) in Reinforcement Learning Evades Local Maxima | OpenReview

Policy Gradient with Tree Search (PGTS) in Reinforcement Learning Evades Local Maxima

Open Webpage

Navdeep Kumar, Priyank Agrawal, Kfir Yehuda Levy, Shie Mannor

Published: 2024, Last Modified: 17 May 2025Tiny Papers @ ICLR 2024EveryoneRevisionsBibTeXCC BY-SA 4.0

Loading