#!/bin/bash


python3 ../../ppo_mlp.py --env_id "Hopper-v4" \
    --total_timesteps 1_000_000 --num_envs 1 --num_eval_envs 100 --num_steps 2048 \
    --gamma 0.99 --gae_lambda 0.95 --num_minibatches 32 --update_epochs 10\
    --norm_adv --anneal_lr --clip_vloss --clip_coef 0.2 --ent_coef 0.0 \
    --target_kl None --max_grad_norm 0.5 --vf_coef 0.5 --learning_rate 3e-4 --final_learning_rate 0.0 \
    --eval_freq 1 --device "cuda:0" --seed 1\
    

python3 ../../ppo_mlp.py --env_id "HalfCheetah-v4" \
    --total_timesteps 1_000_000 --num_envs 1 --num_eval_envs 100 --num_steps 2048 \
    --gamma 0.99 --gae_lambda 0.95 --num_minibatches 32 --update_epochs 10\
    --norm_adv --anneal_lr --clip_vloss --clip_coef 0.2 --ent_coef 0.0 \
    --target_kl None --max_grad_norm 0.5 --vf_coef 0.5 --learning_rate 3e-4 --final_learning_rate 0.0 \
    --eval_freq 1 --device "cuda:0" --seed 1\
    


python3 ../../ppo_mlp.py --env_id "Ant-v4" \
    --total_timesteps 1_000_000 --num_envs 1 --num_eval_envs 100 --num_steps 2048 \
    --gamma 0.99 --gae_lambda 0.95 --num_minibatches 32 --update_epochs 10\
    --norm_adv --anneal_lr --clip_vloss --clip_coef 0.2 --ent_coef 0.0 \
    --target_kl None --max_grad_norm 0.5 --vf_coef 0.5 --learning_rate 3e-4 --final_learning_rate 0.0 \
    --eval_freq 1 --device "cuda:0" --seed 1\
    

python3 ../../ppo_mlp.py --env_id "HalfCheetah-v4" \
    --total_timesteps 1_000_000 --num_envs 1 --num_eval_envs 100 --num_steps 2048 \
    --gamma 0.99 --gae_lambda 0.95 --num_minibatches 32 --update_epochs 10\
    --norm_adv --anneal_lr --clip_vloss --clip_coef 0.2 --ent_coef 0.0 \
    --target_kl None --max_grad_norm 0.5 --vf_coef 0.5 --learning_rate 3e-4 --final_learning_rate 0.0 \
    --eval_freq 1 --device "cuda:0" --seed 2\
    

python3 ../../ppo_mlp.py --env_id "Hopper-v4" \
    --total_timesteps 1_000_000 --num_envs 1 --num_eval_envs 100 --num_steps 2048 \
    --gamma 0.99 --gae_lambda 0.95 --num_minibatches 32 --update_epochs 10\
    --norm_adv --anneal_lr --clip_vloss --clip_coef 0.2 --ent_coef 0.0 \
    --target_kl None --max_grad_norm 0.5 --vf_coef 0.5 --learning_rate 3e-4 --final_learning_rate 0.0 \
    --eval_freq 1 --device "cuda:0" --seed 2\
    

python3 ../../ppo_mlp.py --env_id "Ant-v4" \
    --total_timesteps 1_000_000 --num_envs 1 --num_eval_envs 100 --num_steps 2048 \
    --gamma 0.99 --gae_lambda 0.95 --num_minibatches 32 --update_epochs 10\
    --norm_adv --anneal_lr --clip_vloss --clip_coef 0.2 --ent_coef 0.0 \
    --target_kl None --max_grad_norm 0.5 --vf_coef 0.5 --learning_rate 3e-4 --final_learning_rate 0.0 \
    --eval_freq 1 --device "cuda:0" --seed 2\
    

python3 ../../ppo_mlp.py --env_id "HalfCheetah-v4" \
    --total_timesteps 1_000_000 --num_envs 1 --num_eval_envs 100 --num_steps 2048 \
    --gamma 0.99 --gae_lambda 0.95 --num_minibatches 32 --update_epochs 10\
    --norm_adv --anneal_lr --clip_vloss --clip_coef 0.2 --ent_coef 0.0 \
    --target_kl None --max_grad_norm 0.5 --vf_coef 0.5 --learning_rate 3e-4 --final_learning_rate 0.0 \
    --eval_freq 1 --device "cuda:0" --seed 3\
    

python3 ../../ppo_mlp.py --env_id "Hopper-v4" \
    --total_timesteps 1_000_000 --num_envs 1 --num_eval_envs 100 --num_steps 2048 \
    --gamma 0.99 --gae_lambda 0.95 --num_minibatches 32 --update_epochs 10\
    --norm_adv --anneal_lr --clip_vloss --clip_coef 0.2 --ent_coef 0.0 \
    --target_kl None --max_grad_norm 0.5 --vf_coef 0.5 --learning_rate 3e-4 --final_learning_rate 0.0 \
    --eval_freq 1 --device "cuda:0" --seed 3\
    

python3 ../../ppo_mlp.py --env_id "Ant-v4" \
    --total_timesteps 1_000_000 --num_envs 1 --num_eval_envs 100 --num_steps 2048 \
    --gamma 0.99 --gae_lambda 0.95 --num_minibatches 32 --update_epochs 10\
    --norm_adv --anneal_lr --clip_vloss --clip_coef 0.2 --ent_coef 0.0 \
    --target_kl None --max_grad_norm 0.5 --vf_coef 0.5 --learning_rate 3e-4 --final_learning_rate 0.0 \
    --eval_freq 1 --device "cuda:0" --seed 3\
    