Multi-objective Reinforcement Learning with Nonlinear Preferences: Provable Approximation for Maximizing Expected Scalarized Return | OpenReview

Multi-objective Reinforcement Learning with Nonlinear Preferences: Provable Approximation for Maximizing Expected Scalarized Return

Open Webpage

Nianli Peng, Muhang Tian, Brandon Fain

Published: 2025, Last Modified: 14 Jan 2026AAMAS 2025EveryoneRevisionsBibTeXCC BY-SA 4.0

External IDs:dblp:conf/ifaamas/PengTF25

Loading