Learning Prediction-aware Prior in Transformer Network for Accurate Spatio-Temporal Video Grounding

Xin Wang, Tong Zhang, Yongshun Gong, Jialin Gao, Yanyu Xu, Jin Qian, Xiushan Nie, Lizhen Cui, Chengqi Zhang

Published: 29 Sept 2025, Last Modified: 08 Jan 2026ACM Transactions on Multimedia Computing, Communications, and ApplicationsEveryoneRevisionsCC BY-SA 4.0

External IDs:doi:10.1145/3769088