Do Vision-Language Models Represent Space and How? Evaluating Spatial Frame of Reference under Ambiguities | OpenReview

Do Vision-Language Models Represent Space and How? Evaluating Spatial Frame of Reference under Ambiguities

Open Webpage

Zheyuan Zhang, Fengyuan Hu, Jayjun Lee, Freda Shi, Parisa Kordjamshidi, Joyce Chai, Ziqiao Ma

Published: 2025, Last Modified: 04 May 2026ICLR 2025EveryoneRevisionsBibTeXCC BY-SA 4.0

Loading