Decoding before aligning: Scale-Adaptive Early-Decoding Transformer for visual grounding | OpenReview

Decoding before aligning: Scale-Adaptive Early-Decoding Transformer for visual grounding

Open Webpage

Liuwu Li, Yi Cai, Jiexin Wang, Cantao Wu, Qingbao Huang, Qing Li

Published: 01 Jun 2025, Last Modified: 06 Jan 2026NeurocomputingEveryoneRevisionsCC BY-SA 4.0

External IDs:doi:10.1016/j.neucom.2025.129756

Loading