#!/bin/bash
export OMP_NUM_THREADS=1

export CUDA_VISIBLE_DEVICES=2
python -u run_baselines.py \
  --env_name predator_prey \
  --gacomm \
  --nagents 10 \
  --dim 20 \
  --max_steps 80 \
  --vision 1 \
  --nprocesses 1 \
  --num_epochs 1000 \
  --epoch_size 10 \
  --hid_size 128 \
  --value_coeff 0.01 \
  --detach_gap 10 \
  --lrate 0.001 \
  --recurrent \
  --use_comms_channel \
  --comms_penalty 0.0001 \
  --save \
  --seed 8 \
  --use_wandb \
  --experiment_name GACOMM_COMMS_PP_hard_bench_8 \
  | tee train_pp_hard.log &

export CUDA_VISIBLE_DEVICES=3
python -u run_baselines.py \
  --env_name predator_prey \
  --gacomm \
  --nagents 10 \
  --dim 20 \
  --max_steps 80 \
  --vision 1 \
  --nprocesses 1 \
  --num_epochs 1000 \
  --epoch_size 10 \
  --hid_size 128 \
  --value_coeff 0.01 \
  --detach_gap 10 \
  --lrate 0.001 \
  --recurrent \
  --use_comms_channel \
  --comms_penalty 0.0001 \
  --save \
  --seed 12 \
  --use_wandb \
  --experiment_name GACOMM_COMMS_PP_hard_bench_12 \
  | tee train_pp_hard.log &

export CUDA_VISIBLE_DEVICES=0
python -u run_baselines.py \
  --env_name predator_prey \
  --gacomm \
  --nagents 10 \
  --dim 20 \
  --max_steps 80 \
  --vision 1 \
  --nprocesses 1 \
  --num_epochs 1000 \
  --epoch_size 10 \
  --hid_size 128 \
  --value_coeff 0.01 \
  --detach_gap 10 \
  --lrate 0.001 \
  --recurrent \
  --use_comms_channel \
  --comms_penalty 0.0001 \
  --save \
  --seed 18 \
  --use_wandb \
  --experiment_name GACOMM_COMMS_PP_hard_bench_18 \
  | tee train_pp_hard.log &

export CUDA_VISIBLE_DEVICES=1
python -u run_baselines.py \
  --env_name predator_prey \
  --gacomm \
  --nagents 10 \
  --dim 20 \
  --max_steps 80 \
  --vision 1 \
  --nprocesses 1 \
  --num_epochs 1000 \
  --epoch_size 10 \
  --hid_size 128 \
  --value_coeff 0.01 \
  --detach_gap 10 \
  --lrate 0.001 \
  --recurrent \
  --use_comms_channel \
  --comms_penalty 0.0001 \
  --save \
  --seed 35 \
  --use_wandb \
  --experiment_name GACOMM_COMMS_PP_hard_bench_35 \
  | tee train_pp_hard.log &

export CUDA_VISIBLE_DEVICES=2
python -u run_baselines.py \
  --env_name predator_prey \
  --gacomm \
  --nagents 10 \
  --dim 20 \
  --max_steps 80 \
  --vision 1 \
  --nprocesses 1 \
  --num_epochs 1000 \
  --epoch_size 10 \
  --hid_size 128 \
  --value_coeff 0.01 \
  --detach_gap 10 \
  --lrate 0.001 \
  --recurrent \
  --use_comms_channel \
  --comms_penalty 0.0001 \
  --save \
  --seed 41 \
  --use_wandb \
  --experiment_name GACOMM_COMMS_PP_hard_bench_41 \
  | tee train_pp_hard.log &
