VLMo: Unified Vision-Language Pre-Training with Mixture-of-Modality-Experts. | OpenReview

VLMo: Unified Vision-Language Pre-Training with Mixture-of-Modality-Experts.

Hangbo Bao, Wenhui Wang 0003, Li Dong 0004, Qiang Liu, Owais Khan Mohammed, Kriti Aggarwal, Subhojit Som, Songhao Piao, Furu Wei

07 Nov 2025NeurIPS 2022EveryoneCC BY-SA 4.0

Loading