Contrastive Preference Learning: Learning from Human Feedback without Reinforcement Learning | OpenReview

Contrastive Preference Learning: Learning from Human Feedback without Reinforcement Learning

Open Webpage

Joey Hejna, Rafael Rafailov, Harshit Sikchi, Chelsea Finn, Scott Niekum, W. Bradley Knox, Dorsa Sadigh

Published: 2024, Last Modified: 25 Jan 2025ICLR 2024EveryoneRevisionsBibTeXCC BY-SA 4.0

Loading