Agent/Evaluator,GPT-5,O3,Grok,Opus,Gemini,Sonnet
GPT-5,1.0,1.0,1.0,5.0,4.0,7.3
O3,1.3,1.0,1.0,3.7,1.0,6.7
Grok,1.0,1.0,1.0,5.0,6.3,6.0
Opus,1.3,4.0,3.7,5.3,8.7,8.3
Gemini,1.0,1.0,6.0,7.0,8.3,5.0
Sonnet,3.7,5.3,9.3,7.7,8.3,8.3
