Scaleable input gradient regularization for adversarial robustness

Chris Finlay; Adam M Oberman

Scaleable input gradient regularization for adversarial robustness

Chris Finlay, Adam M Oberman

25 Sept 2019 (modified: 22 Jun 2025)ICLR 2020 Conference Blind SubmissionReaders: Everyone

Keywords: adversarial robustness, gradient regularization, robust certification, robustness bounds

TL;DR: New robust certification bounds motivate gradient regularization for adversarial robustness

Abstract: In this work we revisit gradient regularization for adversarial robustness with some new ingredients. First, we derive new per-image theoretical robustness bounds based on local gradient information. These bounds strongly motivate input gradient regularization. Second, we implement a scaleable version of input gradient regularization which avoids double backpropagation: adversarially robust ImageNet models are trained in 33 hours on four consumer grade GPUs. Finally, we show experimentally and through theoretical certification that input gradient regularization is competitive with adversarial training. Moreover we demonstrate that gradient regularization does not lead to gradient obfuscation or gradient masking.

Community Implementations: [![CatalyzeX](/images/catalyzex_icon.svg) 1 code implementation](https://www.catalyzex.com/paper/scaleable-input-gradient-regularization-for/code)

Original Pdf: pdf

16 Replies

Loading