Aligning Language Models Using Follow-up Likelihood as Reward Signal | OpenReview

Aligning Language Models Using Follow-up Likelihood as Reward Signal

Open Webpage

Chen Zhang, Dading Chong, Feng Jiang, Chengguang Tang, Anningzhe Gao, Guohua Tang, Haizhou Li

Published: 2025, Last Modified: 21 Jan 2026AAAI 2025EveryoneRevisionsBibTeXCC BY-SA 4.0

Loading