CVLP-NaVD: Contrastive Visual-language Pre-training Models for Non-annotated Visual Description

Haoran Li, Yanbin Hao, Jiarui Yu, Bin Zhu, Shuo Wang, Tong Xu

Published: 30 Nov 2025, Last Modified: 07 Jan 2026ACM Transactions on Multimedia Computing, Communications, and ApplicationsEveryoneRevisionsCC BY-SA 4.0

External IDs:doi:10.1145/3708348