# nohup python -u ./src/rl/RAPC-PPO.py \
# --EXP_NAME=F16Avoid \
# --DIR=f16_avoid \
# --NUM_ENVS=2048 \
# --NUM_STEPS=200 \
# --TOTAL_TIMESTEPS=20_000_000 \
# --STEP_SCAN=10 \
# --UPDATE_EPOCHS=10 \
# --NUM_MINIBATCHES=64 \
# --TASK_PROB=0.6 \
# --GAMMA_ENERGY=0.99 \
# --GAMMA_REACH_INIT=0.999 \
# --GAMMA_REACH_FINAL=0.999 \
# --GAE_LAMBDA=0.95 \
# --CLIP_EPS=0.2 \
# --ENT_COEF=0.01 \
# --VF_COEF=2.0 \
# --MAX_GRAD_NORM=0.5 \
# --POLICY_LR=3e-4 \
# --VALUE_LR=1e-3 \
# --LAGRANGE_LR=5e-5 \
# --PHI_LR=1e-3 \
# --CUDA_USE=3 \
# --ANNEAL_ENT \
# --NAME=f16_final > ./logs/f16_final_$(date +%Y%m%d_%H%M%S).log 2>&1 &

LOG=./logs/f16_final_$(date +%Y%m%d_%H%M%S).log

nohup python -u ./rl/RAPC-PPO.py \
--EXP_NAME=F16Avoid \
--DIR=f16_avoid \
--NUM_ENVS=2048 \
--NUM_STEPS=400 \
--TOTAL_TIMESTEPS=210_000_000 \
--STEP_SCAN=10 \
--UPDATE_EPOCHS=10 \
--NUM_MINIBATCHES=64 \
--TASK_PROB=0.95 \
--GAMMA_ENERGY=0.99 \
--GAMMA_REACH_INIT=0.999 \
--GAMMA_REACH_FINAL=0.999 \
--GAE_LAMBDA=0.95 \
--CLIP_EPS=0.2 \
--ENT_COEF=0.01 \
--VF_COEF=2.0 \
--MAX_GRAD_NORM=0.5 \
--POLICY_LR=3e-4 \
--VALUE_LR=1e-3 \
--LAGRANGE_LR=5e-5 \
--PHI_LR=1e-3 \
--CUDA_USE=0 \
--ANNEAL_ENT \
--NAME=f16_final \
  > "$LOG" \
  2> >(grep -v "ptx86" >> "$LOG") &