Adaptive Inference for Medical Vision Transformers: Token Reduction or Early Exit?

Ji Young Byun; Hyun Seo Lee; Jordan M Shuff; Nakul S. Shekhawat; Kunal S Parikh; Rama Chellappa

Adaptive Inference for Medical Vision Transformers: Token Reduction or Early Exit?

Ji Young Byun, Hyun Seo Lee, Jordan M Shuff, Nakul S. Shekhawat, Kunal S Parikh, Rama Chellappa

Published: 14 Feb 2026, Last Modified: 14 Feb 2026MIDL 2026 PosterEveryoneRevisionsBibTeXCC BY 4.0

Keywords: Vision Transformers, Efficient Inference, Adaptive Computation, Token Reduction, Early Exit

Abstract: Vision Transformers (ViTs) have demonstrated exceptional performance in medical image analysis, yet their computational demands hinder clinical deployment, particularly in time-sensitive applications. Medical imaging requires sample-adaptive optimization due to dataset heterogeneity across modalities and sample complexity; uniform strategies do not well balance efficiency and accuracy. We propose a unified adaptive inference framework that combines Token Reduction (TR) and Early Exiting (EE) through dataset-specific profiling. Our approach quantifies spatial redundancy via Jensen-Shannon Divergence (JSD) and prediction confidence at intermediate layers to train a lightweight predictor that dynamically selects inference strategies at test time. Across five medical datasets, including a real-world cataract dataset (INSIGHT), our framework achieves 71.4% average floating-point operations per second (FLOPs) reduction with only 0.1pp accuracy loss, substantially outperforming individual strategies (EE-only: 55.9%, TR-only: 57.7%). On PathMNIST, our adaptive inference framework simultaneously improves accuracy by 1.3pp while reducing computation by 77.2%. On INSIGHT, we maintain baseline accuracy with 69.8% FLOPs reduction, demonstrating robust real-world clinical applicability.

Primary Subject Area: Detection and Diagnosis

Secondary Subject Area: Application: Ophthalmology

Registration Requirement: Yes

Visa & Travel: No

Read CFP & Author Instructions: Yes

Originality Policy: Yes

Single-blind & Not Under Review Elsewhere: Yes

LLM Policy: Yes

Submission Number: 177

Loading