Unraveling and Mitigating Safety Alignment Degradation of Vision-Language Models | OpenReview

Unraveling and Mitigating Safety Alignment Degradation of Vision-Language Models

Open Webpage

Qin Liu, Chao Shang, Ling Liu, Nikolaos Pappas, Jie Ma, Neha Anna John, Srikanth Doss, Lluis Marquez, Miguel Ballesteros, Yassine Benajiba

Published: 01 Jan 2025, Last Modified: 26 Jan 2026University of California Publication Management SystemEveryoneRevisionsBibTeXCC BY-SA 4.0

External IDs:doi:10.18653/v1/2025.findings-acl.186

Loading