Diff-ZsVQA: Zero-shot Visual Question Answering with Frozen Large Language Models Using Diffusion Model | OpenReview

Diff-ZsVQA: Zero-shot Visual Question Answering with Frozen Large Language Models Using Diffusion Model

Open Webpage

Quanxing Xu, Jian Li, Yuhao Tian, Ling Zhou, Feifei Zhang, Rubing Huang

Published: 01 May 2025, Last Modified: 15 May 2026Expert Systems with ApplicationsEveryoneRevisionsCC BY-SA 4.0

External IDs:doi:10.1016/j.eswa.2025.126951

Loading