OpenReview.net

Login

Back to ICML

ICML 2023 Workshop MFPL Submissions

Loading

About OpenReview
Hosting a Venue
All Venues

Contact
Sponsors
Donate

FAQ
Terms of Use / Privacy Policy
News

About OpenReview
Hosting a Venue
All Venues
Sponsors
News

FAQ
Contact
Donate
Terms of Use
Privacy Policy

OpenReview is a long-term project to advance science through improved peer review with legal nonprofit status. We gratefully acknowledge the support of the OpenReview Sponsors. © 2026 OpenReview

Multi-Objective Agency Requires Non-Markovian Rewards
Silviu Pitis
- Published: 29 Jun 2023, Last Modified: 04 Oct 2023
- MFPL Poster
- Readers: Everyone
Failure Modes of Learning Reward Models for LLMs and other Sequence Models
Silviu Pitis
- Published: 29 Jun 2023, Last Modified: 04 Oct 2023
- MFPL Poster
- Readers: Everyone
Video-Guided Skill Discovery
Manan Tomar, Dibya Ghosh, Vivek Myers, Anca Dragan, Matthew E. Taylor, Philip Bachman, Sergey Levine
- Published: 29 Jun 2023, Last Modified: 04 Oct 2023
- MFPL Poster
- Readers: Everyone
Learning from Pairwise Comparisons Under Preference Reversals
Abdul Bakey Mir, Arun Rajkumar
- Published: 29 Jun 2023, Last Modified: 04 Oct 2023
- MFPL Poster
- Readers: Everyone
Randomized Smoothing (almost) in Real Time?
Emmanouil Seferis, Simon Burton, Stefanos Kollias
- Published: 29 Jun 2023, Last Modified: 04 Oct 2023
- MFPL Poster
- Readers: Everyone
Pretrained deep models outperform GBDTs in Learning-To-Rank under label scarcity
Charlie Hou, Kiran Koshy Thekumparampil, Michael Shavlovsky, Giulia Fanti, Yesh Dattatreya, sujay sanghavi
- Published: 29 Jun 2023, Last Modified: 04 Oct 2023
- MFPL Oral
- Readers: Everyone
Preference Proxies: Evaluating Large Language Models in capturing Human Preferences in Human-AI Tasks
Mudit Verma, Siddhant Bhambri, Subbarao Kambhampati
- Published: 29 Jun 2023, Last Modified: 04 Oct 2023
- MFPL Oral
- Readers: Everyone
Exploiting Action Distances for Reward Learning from Human Preferences
Mudit Verma, Siddhant Bhambri, Subbarao Kambhampati
- Published: 29 Jun 2023, Last Modified: 04 Oct 2023
- MFPL Poster
- Readers: Everyone
Reward Collapse in Aligning Large Language Models: A Prompt-Aware Approach to Preference Rankings
Ziang Song, Tianle Cai, Jason D. Lee, Weijie J Su
- Published: 29 Jun 2023, Last Modified: 04 Oct 2023
- MFPL Poster
- Readers: Everyone
Direct Preference Optimization: Your Language Model is Secretly a Reward Model
Rafael Rafailov, Archit Sharma, Eric Mitchell, Stefano Ermon, Christopher D Manning, Chelsea Finn
- Published: 29 Jun 2023, Last Modified: 04 Oct 2023
- MFPL Poster
- Readers: Everyone
Ranking with Abstention
Anqi Mao, Mehryar Mohri, Yutao Zhong
- Published: 29 Jun 2023, Last Modified: 04 Oct 2023
- MFPL Poster
- Readers: Everyone
Learning Higher Order Skills that Efficiently Compose
Anthony Zhe Liu, Dong-Ki Kim, Sungryull Sohn, Honglak Lee
- Published: 29 Jun 2023, Last Modified: 04 Oct 2023
- MFPL Poster
- Readers: Everyone
DIP-RL: Demonstration-Inferred Preference Learning in Minecraft
Ellen Novoseller, Vinicius G. Goecks, David Watkins, Josh Miller, Nicholas R Waytowich
- Published: 29 Jun 2023, Last Modified: 04 Oct 2023
- MFPL Poster
- Readers: Everyone
Learning Optimal Advantage from Preferences and Mistaking it for Reward
W. Bradley Knox, Stephane Hatgis-Kessell, Sigurdur Orn Adalgeirsson, Serena Booth, Anca Dragan, Peter Stone, Scott Niekum
- Published: 29 Jun 2023, Last Modified: 04 Oct 2023
- MFPL Oral
- Readers: Everyone
Differentially Private Reward Estimation from Preference Based Feedback
Sayak Ray Chowdhury, Xingyu Zhou
- Published: 29 Jun 2023, Last Modified: 04 Oct 2023
- MFPL Poster
- Readers: Everyone
Intention is what you need to estimate: Attention-driven prediction of goal pose in a human-centric telemanipulation of a robotic hand
Muneeb Ahmed, Rajesh Kumar, Arzad Kherani, Brejesh Lall
- Published: 29 Jun 2023, Last Modified: 04 Oct 2023
- MFPL Poster
- Readers: Everyone
Representation Learning in Low-rank Slate-based Recommender Systems
Yijia Dai, Wen Sun
- Published: 29 Jun 2023, Last Modified: 04 Oct 2023
- MFPL Poster
- Readers: Everyone
Borda Regret Minimization for Generalized Linear Dueling Bandits
Yue Wu, Tao Jin, Qiwei Di, Hao Lou, Farzad Farnoud, Quanquan Gu
- Published: 29 Jun 2023, Last Modified: 04 Oct 2023
- MFPL Poster
- Readers: Everyone
Learning Populations of Preferences via Pairwise Comparison Queries
Gokcan Tatli, Yi Chen, Ramya Korlakai Vinayak
- Published: 29 Jun 2023, Last Modified: 04 Oct 2023
- MFPL Poster
- Readers: Everyone
A Ranking Game for Imitation Learning
Harshit Sikchi, Akanksha Saran, Wonjoon Goo, Scott Niekum
- Published: 29 Jun 2023, Last Modified: 04 Oct 2023
- MFPL Poster
- Readers: Everyone
AdaptiveRec: Adaptively Construct Pairs for Contrastive Learning in Sequential Recommendation
JaeHeyoung Jeon, Jung Hyun Ryu, Jewoong Cho, Myungjoo Kang
- Published: 29 Jun 2023, Last Modified: 04 Oct 2023
- MFPL Poster
- Readers: Everyone
Perceptual adjustment queries: An inverted measurement paradigm for low-rank metric learning
Austin Xu, Andrew D. McRae, Jingyan Wang, Mark A. Davenport, Ashwin Pananjady
- Published: 29 Jun 2023, Last Modified: 04 Oct 2023
- MFPL Poster
- Readers: Everyone
Rating-based Reinforcement Learning
Devin White, Mingkang Wu, Ellen Novoseller, Vernon Lawhern, Nicholas R Waytowich, Yongcan Cao
- Published: 29 Jun 2023, Last Modified: 04 Oct 2023
- MFPL Poster
- Readers: Everyone
HIP-RL: Hallucinated Inputs for Preference-based Reinforcement Learning in Continuous Domains
Chen Bo Calvin Zhang, Giorgia Ramponi
- Published: 29 Jun 2023, Last Modified: 04 Oct 2023
- MFPL Poster
- Readers: Everyone
Fairness in Preference-based Reinforcement Learning
Umer Siddique, Abhinav Sinha, Yongcan Cao
- Published: 29 Jun 2023, Last Modified: 04 Oct 2023
- MFPL Poster
- Readers: Everyone

«
‹
1
2
3
›
»