Near-optimal Offline Reinforcement Learning with Linear Representation: Leveraging Variance Information with Pessimism | OpenReview

Near-optimal Offline Reinforcement Learning with Linear Representation: Leveraging Variance Information with Pessimism

Open Webpage

Ming Yin, Yaqi Duan, Mengdi Wang, Yu-Xiang Wang

Published: 2022, Last Modified: 23 May 2024ICLR 2022EveryoneRevisionsBibTeXCC BY-SA 4.0

Loading