A Transformer-based visual object tracker via learning immediate appearance change

Yifan Li, Xiaotao Liu, Dian Yuan, Jiaoying Wang, Peng Wu, Jing Liu

Published: 2024, Last Modified: 13 Nov 2024Pattern Recognit. 2024EveryoneRevisionsBibTeXCC BY-SA 4.0

Abstract: Highlights•A transformer tracking framework modeling spatial–temporal features is proposed.•A temporal information extractor is proposed to learn immediate appearance change.•A spatial–temporal context enhanced fusion module is proposed to integrate features.