Unleashing Uncertainty: Efficient Machine Unlearning for Generative AI

Christoforos N. Spartalis; Theodoros Semertzidis; Petros Daras; Stratis Gavves

Unleashing Uncertainty: Efficient Machine Unlearning for Generative AI

Christoforos N. Spartalis, Theodoros Semertzidis, Petros Daras, Stratis Gavves

Published: 11 Jun 2025, Last Modified: 02 Jul 2025MUGen @ ICML 2025 PosterEveryoneRevisionsBibTeXCC BY 4.0

Keywords: Machine Unlearning

TL;DR: Controlled entropy maximization for effective and significantly more efficient machine unlearning in diffusion models.

Abstract: We introduce SAFEMax, a novel method for Machine Unlearning in diffusion models. Grounded in information-theoretic principles, SAFEMax maximizes the entropy in generated images, causing the model to generate Gaussian noise when conditioned on impermissible classes by ultimately halting its denoising process. Also, our method controls the balance between forgetting and retention by selectively focusing on the early diffusion steps, where class-specific information is prominent. Our results demonstrate the effectiveness of SAFEMax and highlight its substantial efficiency gains over state-of-the-art methods.

Submission Number: 20

Loading