PrLM: Learning Explicit Reasoning for Personalized RAG via Contrastive Reward Optimization | OpenReview

PrLM: Learning Explicit Reasoning for Personalized RAG via Contrastive Reward Optimization

Open Webpage

Kepu Zhang, Teng Shi, Weijie Yu, Jun Xu

Published: 10 Nov 2025, Last Modified: 15 Jan 2026CrossrefEveryoneRevisionsCC BY-SA 4.0

External IDs:doi:10.1145/3746252.3760851

Loading