Can You Rely on Synthetic Labellers in Preference-Based Reinforcement Learning? It's Complicated | OpenReview

Can You Rely on Synthetic Labellers in Preference-Based Reinforcement Learning? It's Complicated

Open Webpage

Katherine Metcalf, Miguel Sarabia, Masha Fedzechkina, Barry-John Theobald

Published: 2024, Last Modified: 18 May 2025AAAI 2024EveryoneRevisionsBibTeXCC BY-SA 4.0

Loading