cliffwalking#!/usr/bin/env bash
set -e

echo "Starting experiments..."

echo "Run experiments of reg baseline"
python ../train.py --algo dqn --eps_train 0.25 --eps_infer 0 --alpha_d0 0 --horizon 500 --seed 3 --experiment exp3_reg --num_episodes 4000 --env cliffwalking --variable baseline
python ../train.py --algo dqn --eps_train 0.25 --eps_infer 0 --alpha_d0 0 --horizon 500 --seed 1 --experiment exp3_reg --num_episodes 4000 --env cliffwalking --variable baseline
python ../train.py --algo dqn --eps_train 0.25 --eps_infer 0 --alpha_d0 0 --horizon 500 --seed 2 --experiment exp3_reg --num_episodes 4000 --env cliffwalking --variable baseline
python ../train.py --algo dqn --eps_train 0.25 --eps_infer 0 --alpha_d0 0 --horizon 500 --seed 4 --experiment exp3_reg --num_episodes 4000 --env cliffwalking --variable baseline
python ../train.py --algo dqn --eps_train 0.25 --eps_infer 0 --alpha_d0 0 --horizon 500 --seed 5 --experiment exp3_reg --num_episodes 4000 --env cliffwalking --variable baseline

echo "Run experiments of l2"
python ../train.py --algo dqn --eps_train 0.25 --eps_infer 0 --alpha_d0 0 --horizon 500 --l2_coef 1e-7 --seed 3 --experiment exp3_reg --num_episodes 4000 --env cliffwalking --variable l2_train_25
python ../train.py --algo dqn --eps_train 0.25 --eps_infer 0 --alpha_d0 0 --horizon 500 --l2_coef 1e-7 --seed 1 --experiment exp3_reg --num_episodes 4000 --env cliffwalking --variable l2_train_25
python ../train.py --algo dqn --eps_train 0.25 --eps_infer 0 --alpha_d0 0 --horizon 500 --l2_coef 1e-7 --seed 2 --experiment exp3_reg --num_episodes 4000 --env cliffwalking --variable l2_train_25
python ../train.py --algo dqn --eps_train 0.25 --eps_infer 0 --alpha_d0 0 --horizon 500 --l2_coef 1e-7 --seed 4 --experiment exp3_reg --num_episodes 4000 --env cliffwalking --variable l2_train_25
python ../train.py --algo dqn --eps_train 0.25 --eps_infer 0 --alpha_d0 0 --horizon 500 --l2_coef 1e-7 --seed 5 --experiment exp3_reg --num_episodes 4000 --env cliffwalking --variable l2_train_25


echo "Run experiments of layernorm"
python ../train.py --algo dqn --eps_train 0.25 --eps_infer 0 --alpha_d0 0 --horizon 500 --layernorm --seed 3 --experiment exp3_reg --num_episodes 4000 --env cliffwalking --variable ln_train_25
python ../train.py --algo dqn --eps_train 0.25 --eps_infer 0 --alpha_d0 0 --horizon 500 --layernorm --seed 1 --experiment exp3_reg --num_episodes 4000 --env cliffwalking --variable ln_train_25
python ../train.py --algo dqn --eps_train 0.25 --eps_infer 0 --alpha_d0 0 --horizon 500 --layernorm --seed 2 --experiment exp3_reg --num_episodes 4000 --env cliffwalking --variable ln_train_25
python ../train.py --algo dqn --eps_train 0.25 --eps_infer 0 --alpha_d0 0 --horizon 500 --layernorm --seed 4 --experiment exp3_reg --num_episodes 4000 --env cliffwalking --variable ln_train_25
python ../train.py --algo dqn --eps_train 0.25 --eps_infer 0 --alpha_d0 0 --horizon 500 --layernorm --seed 5 --experiment exp3_reg --num_episodes 4000 --env cliffwalking --variable ln_train_25

echo "Run experiments of weightnorm"
python ../train.py --algo dqn --eps_train 0.25 --eps_infer 0 --alpha_d0 0 --horizon 500 --weightnorm --seed 3 --experiment exp3_reg --num_episodes 4000 --env cliffwalking --variable wn_train_25
python ../train.py --algo dqn --eps_train 0.25 --eps_infer 0 --alpha_d0 0 --horizon 500 --weightnorm --seed 1 --experiment exp3_reg --num_episodes 4000 --env cliffwalking --variable wn_train_25
python ../train.py --algo dqn --eps_train 0.25 --eps_infer 0 --alpha_d0 0 --horizon 500 --weightnorm --seed 2 --experiment exp3_reg --num_episodes 4000 --env cliffwalking --variable wn_train_25
python ../train.py --algo dqn --eps_train 0.25 --eps_infer 0 --alpha_d0 0 --horizon 500 --weightnorm --seed 4 --experiment exp3_reg --num_episodes 4000 --env cliffwalking --variable wn_train_25
python ../train.py --algo dqn --eps_train 0.25 --eps_infer 0 --alpha_d0 0 --horizon 500 --weightnorm --seed 5 --experiment exp3_reg --num_episodes 4000 --env cliffwalking --variable wn_train_25

echo "All experiments finished."