#!/bin/bash
export OMP_NUM_THREADS=1

python3 -u run_baselines.py \
  --env_name predator_prey \
  --tarcomm \
  --ic3net \
  --nagents 5 \
  --dim 10 \
  --max_steps 40 \
  --vision 1 \
  --nprocesses 1 \
  --num_epochs 500 \
  --epoch_size 10 \
  --hid_size 128 \
  --value_coeff 0.01 \
  --detach_gap 10 \
  --lrate 0.001 \
  --recurrent \
  --use_comms_channel \
  --comms_penalty 0.0001 \
  --save \
  --seed 8 \
  --use_wandb \
  --experiment_name TarMAC-IC3Net_COMM_PP_medium_bench_8 \
  | tee train_pp_medium.log &

python3 -u run_baselines.py \
  --env_name predator_prey \
  --tarcomm \
  --ic3net \
  --nagents 5 \
  --dim 10 \
  --max_steps 40 \
  --vision 1 \
  --nprocesses 1 \
  --num_epochs 500 \
  --epoch_size 10 \
  --hid_size 128 \
  --value_coeff 0.01 \
  --detach_gap 10 \
  --lrate 0.001 \
  --recurrent \
  --use_comms_channel \
  --comms_penalty 0.0001 \
  --save \
  --seed 12 \
  --use_wandb \
  --experiment_name TarMAC-IC3Net_COMM_PP_medium_bench_12 \
  | tee train_pp_medium.log &

python3 -u run_baselines.py \
  --env_name predator_prey \
  --tarcomm \
  --ic3net \
  --nagents 5 \
  --dim 10 \
  --max_steps 40 \
  --vision 1 \
  --nprocesses 1 \
  --num_epochs 500 \
  --epoch_size 10 \
  --hid_size 128 \
  --value_coeff 0.01 \
  --detach_gap 10 \
  --lrate 0.001 \
  --recurrent \
  --use_comms_channel \
  --comms_penalty 0.0001 \
  --save \
  --seed 18 \
  --use_wandb \
  --experiment_name TarMAC-IC3Net_COMM_PP_medium_bench_18 \
  | tee train_pp_medium.log &

python3 -u run_baselines.py \
  --env_name predator_prey \
  --tarcomm \
  --ic3net \
  --nagents 5 \
  --dim 10 \
  --max_steps 40 \
  --vision 1 \
  --nprocesses 1 \
  --num_epochs 500 \
  --epoch_size 10 \
  --hid_size 128 \
  --value_coeff 0.01 \
  --detach_gap 10 \
  --lrate 0.001 \
  --recurrent \
  --use_comms_channel \
  --comms_penalty 0.0001 \
  --save \
  --seed 35 \
  --use_wandb \
  --experiment_name TarMAC-IC3Net_COMM_PP_medium_bench_35 \
  | tee train_pp_medium.log &

python3 -u run_baselines.py \
  --env_name predator_prey \
  --tarcomm \
  --ic3net \
  --nagents 5 \
  --dim 10 \
  --max_steps 40 \
  --vision 1 \
  --nprocesses 1 \
  --num_epochs 500 \
  --epoch_size 10 \
  --hid_size 128 \
  --value_coeff 0.01 \
  --detach_gap 10 \
  --lrate 0.001 \
  --recurrent \
  --use_comms_channel \
  --comms_penalty 0.0001 \
  --save \
  --seed 41 \
  --use_wandb \
  --experiment_name TarMAC-IC3Net_COMM_PP_medium_bench_41 \
  | tee train_pp_medium.log &
