SALMON: Self-Alignment with Instructable Reward Models | OpenReview

SALMON: Self-Alignment with Instructable Reward Models

Open Webpage

Zhiqing Sun, Yikang Shen, Hongxin Zhang, Qinhong Zhou, Zhenfang Chen, David Daniel Cox, Yiming Yang, Chuang Gan

Published: 2024, Last Modified: 23 Nov 2024ICLR 2024EveryoneRevisionsBibTeXCC BY-SA 4.0

Loading