User Input,spatial_understanding
Difficulty,Model,Objective Score,Alignment Rate
easy,GPT-4o,0.8609625668449198,0.7791666666666667
easy,GPT-4o mini,0.8128342245989305,0.7791666666666667
easy,Gemini-Flash,0.8181818181818182,0.7791666666666667
easy,Claude-3.5,0.839572192513369,0.7791666666666667
easy,Claude-3,0.8021390374331551,0.7791666666666667
easy,GLM-4v,0.839572192513369,0.7791666666666667
easy,Qwen2-VL,0.81818181818181,0
medium,GPT-4o,0.7224669603524229,0.9458333333333333
medium,GPT-4o mini,0.672566371681416,0.9416666666666667
medium,Gemini-Flash,0.6696035242290749,0.9458333333333333
medium,Claude-3.5,0.6784140969162996,0.9458333333333333
medium,Claude-3,0.6475770925110133,0.9458333333333333
medium,GLM-4v,0.748898678414097,0.9458333333333333
medium,Qwen2-VL,0.7400881057268722,0
hard,GPT-4o,0.6828193832599119,0.9458333333333333
hard,GPT-4o mini,0.6123348017621145,0.9458333333333333
hard,Gemini-Flash,0.6519823788546255,0.9458333333333333
hard,Claude-3.5,0.6460176991150443,0.9416666666666667
hard,Claude-3,0.5814977973568282,0.9458333333333333
hard,GLM-4v,0.6079295154185022,0.9458333333333333
hard,Qwen2-VL,0.6475770925110133,0
