Reward tampering problems and solutions in reinforcement learning: a causal influence diagram perspective | OpenReview

Reward tampering problems and solutions in reinforcement learning: a causal influence diagram perspective

Tom Everitt, Marcus Hutter, Ramana Kumar, Victoria Krakovna

2021 (modified: 09 Jan 2023)Synth. 2021Readers: Everyone

0 Replies

Loading