Grounding Multimodal Large Language Models to the World. | OpenReview

Grounding Multimodal Large Language Models to the World.

Zhiliang Peng, Wenhui Wang 0003, Li Dong 0004, Yaru Hao, Shaohan Huang, Shuming Ma, Qixiang Ye, Furu Wei

07 Nov 2025ICLR 2024EveryoneCC BY-SA 4.0

Loading