Whittle index based Q-learning for restless bandits with average reward | OpenReview

Whittle index based Q-learning for restless bandits with average reward

Konstantin E. Avrachenkov, Vivek S. Borkar

Published: 2022, Last Modified: 10 May 2023Autom. 2022Readers: Everyone

0 Replies

Loading