python eval.py --model "claude-37" --executor_model "gpt-4o-mini" --agent_type planner --num_agents 2 --level all --ablation