nohup python -u ./src/rl/RAPC-PPO.py \
--EXP_NAME=PendulumConstraint \
--DIR=pendulum_constraint \
--NUM_ENVS=512 \
--NUM_STEPS=600 \
--TOTAL_TIMESTEPS=20_000_000 \
--STEP_SCAN=10 \
--UPDATE_EPOCHS=10 \
--NUM_MINIBATCHES=32 \
--TASK_PROB=-0.5 \
--GAMMA_ENERGY=0.99 \
--GAMMA_REACH_INIT=0.999 \
--GAMMA_REACH_FINAL=0.999 \
--GAE_LAMBDA=0.95 \
--CLIP_EPS=0.2 \
--ENT_COEF=0.01 \
--VF_COEF=0.5 \
--MAX_GRAD_NORM=0.5 \
--POLICY_LR=3e-4 \
--VALUE_LR=1e-3 \
--LAGRANGE_LR=5e-5 \
--PHI_LR=1e-3 \
--CUDA_USE=0 \
--ANNEAL_ENT \
--NAME=pendulum_final >  ./logs/pendulum_final_$(date +%Y%m%d_%H%M%S).log 2>&1 &