# nohup python -u ./src/rl/RAPC-PPO.py \
# --EXP_NAME=HalfCheetahAvoid \
# --DIR=halfcheetah_avoid \
# --NUM_ENVS=2048 \
# --NUM_STEPS=200 \
# --TOTAL_TIMESTEPS=20_000_000 \
# --STEP_SCAN=4 \
# --UPDATE_EPOCHS=10 \
# --NUM_MINIBATCHES=32 \
# --TASK_PROB=0.6 \
# --GAMMA_ENERGY=0.99 \
# --GAMMA_REACH_INIT=0.999 \
# --GAMMA_REACH_FINAL=0.999 \
# --GAE_LAMBDA=0.95 \
# --CLIP_EPS=0.2 \
# --ENT_COEF=0.01 \
# --VF_COEF=2.0 \
# --MAX_GRAD_NORM=0.5 \
# --POLICY_LR=3e-4 \
# --VALUE_LR=1e-3 \
# --LAGRANGE_LR=5e-5 \
# --PHI_LR=1e-3 \
# --CUDA_USE=1 \
# --ANNEAL_ENT \
# --NAME=halfcheetah_final > ./logs/halfcheetah_final_$(date +%Y%m%d_%H%M%S).log 2>&1 &

LOG=./logs/halfcheetah_final_$(date +%Y%m%d_%H%M%S).log

nohup python -u ./rl/RAPC-PPO.py \
    --EXP_NAME=HalfCheetahAvoid \
    --DIR=halfcheetah_avoid \
    --NUM_ENVS=2048 \
    --NUM_STEPS=200 \
    --TOTAL_TIMESTEPS=320_000_000 \
    --STEP_SCAN=4 \
    --UPDATE_EPOCHS=10 \
    --NUM_MINIBATCHES=32 \
    --TASK_PROB=0.6 \
    --GAMMA_ENERGY=0.99 \
    --GAMMA_REACH_INIT=0.999 \
    --GAMMA_REACH_FINAL=0.999 \
    --GAE_LAMBDA=0.95 \
    --CLIP_EPS=0.2 \
    --ENT_COEF=0.01 \
    --VF_COEF=2.0 \
    --MAX_GRAD_NORM=0.5 \
    --POLICY_LR=3e-4 \
    --VALUE_LR=1e-3 \
    --LAGRANGE_LR=5e-5 \
    --PHI_LR=1e-3 \
    --CUDA_USE=4 \
    --ANNEAL_ENT \
    --NAME=halfcheetah_final \
  > "$LOG" \
  2> >(grep -v "ptx86" >> "$LOG") &
