TASK_IDS=(40000 40001 40002 40003 40004 40010 40011 40012 40013 40014 40020 40021 40022 40023 40030 40031 40032 40033 40034 40040 40041 40042 40043 40044 40050 40051 40052 40053 40060 40061 40062 40063 40064 40070 40071 40072 40073 40074 40075 40076 40080 40081 40082 40083 40084 40090 40091 40092 40093 40094 40100 40101 40102 40103 40104 40110 40111 40112 40113 40114 40120 40121 40122 40123 40124 40130 40131 40132 40133 40134 40140 40141 40142 40143 40144 40150 40151 40152 40160 40161 40162 40163 40164 40170 40171 40172 40173 40174 40180 40181 40182 40190 40191 40192 40193 40194 40200 40201 40202 40210 40211 40212 40220 40221 40222 40230 40231 40232 40240 40241 40242 40243 40244 40250 40251 40252 40253 40254 40260 40261 40262 40263 40264 40270 40271 40272 40273)
export CALC_AVAILABLE=False

source env_setup_wa.sh

MODEL="claude-sonnet-4-20250514-reasoning"
TYPE="auto"
for task_id in "${TASK_IDS[@]}"
do
RESULT_DIR="results/gitlab/${TYPE}_single/${MODEL}/webchorearena.${task_id}"

  if [ -d "$RESULT_DIR" ]; then
    echo "Skipping ${task_id} (already exists)"
    continue
  fi
  python run.py --action_space webarena --max_new_tokens 8000 --tips True --demo_mode False --multi_actions false --observation_type ${TYPE} --task_name webchorearena.${task_id} --model_name ${MODEL} --result_dir results/gitlab/${TYPE}_single/${MODEL}/
done

