Training language models to follow instructions with human feedback | OpenReview

Training language models to follow instructions with human feedback

Download PDF

Open Webpage

Long Ouyang, Jeffrey Wu, Xu Jiang, Diogo Almeida, Carroll L. Wainwright, Pamela Mishkin, Chong Zhang, Sandhini Agarwal, Katarina Slama, Alex Ray, John Schulman, Jacob Hilton, Fraser Kelton, Luke Miller, Maddie Simens, Amanda Askell, Peter Welinder, Paul F. Christiano, Jan Leike, Ryan Lowe

Published: 2022, Last Modified: 05 May 2026NeurIPS 2022EveryoneRevisionsBibTeXCC BY-SA 4.0

External IDs:dblp:conf/nips/Ouyang0JAWMZASR22

Loading