Training-free subject-enhanced attention guidance for compositional text-to-image generation

Shengyuan Liu, Bo Wang, Ye Ma, Te Yang, Quan Chen, Di Dong

Published: 01 Feb 2026, Last Modified: 24 Oct 2025Pattern RecognitionEveryoneRevisionsCC BY-SA 4.0

Abstract: Highlights•Propose a zero-shot diffusion-based framework for subject-driven generation task.•Introduce a training-free subject-enhanced attention guidance.•Propose a novel evaluation metric GroundingScore for comprehensive assessment.

External IDs:doi:10.1016/j.patcog.2025.112111