Weighted-Reward Preference Optimization for Implicit Model Fusion | OpenReview

Weighted-Reward Preference Optimization for Implicit Model Fusion

Open Webpage

Ziyi Yang, Fanqi Wan, Longguang Zhong, Tianyuan Shi, Xiaojun Quan

Published: 2025, Last Modified: 17 May 2025ICLR 2025EveryoneRevisionsBibTeXCC BY-SA 4.0

Loading