Offline RL with No OOD Actions: In-Sample Learning via Implicit Value Regularization | OpenReview

Offline RL with No OOD Actions: In-Sample Learning via Implicit Value Regularization

Open Webpage

Haoran Xu, Li Jiang, Jianxiong Li, Zhuoran Yang, Zhaoran Wang, Wai Kin Victor Chan, Xianyuan Zhan

Published: 2023, Last Modified: 25 Jan 2026ICLR 2023EveryoneRevisionsBibTeXCC BY-SA 4.0

Loading