Efficiently Gluing Pre-Trained Language and Vision Models for Image Captioning | OpenReview

Efficiently Gluing Pre-Trained Language and Vision Models for Image Captioning

Open Webpage

Peipei Song, Yuanen Zhou, Xun Yang, Daqing Liu, Zhenzhen Hu, Depeng Wang, Meng Wang

Published: 2024, Last Modified: 27 Jan 2026ACM Trans. Intell. Syst. Technol. 2024EveryoneRevisionsBibTeXCC BY-SA 4.0

External IDs:dblp:journals/tist/SongZYLHWW24

Loading