python ppo_props_continuous.py -f results_rl -s b_2 --env-id Hopper-v4 --total-timesteps 1000000 --eval-freq 10 -lr 0.001 --num-steps 2048 --update-epochs 10 --anneal-lr 1 -b 2 --props 1 --props-num-steps 256 -props-lr 0.001 --props-update-epochs 16 --props-num-minibatches 16 --props-clip-coef 0.3 --props-anneal-lr 0 --log-stats 1 --se 1 --se-lr 1e-3 --se-epochs 100  --props-lambda 0.3   --target-kl 0.03 --props-target-kl 0.05
python ppo_props_continuous.py -f results_rl -s b_2 --env-id Walker2d-v4 --total-timesteps 2000000 --eval-freq 10 -lr 0.001 --num-steps 2048 --update-epochs 10 --anneal-lr 1 -b 2 --props 1 --props-num-steps 256 -props-lr 0.001 --props-update-epochs 16 --props-num-minibatches 32 --props-clip-coef 0.3 --props-anneal-lr 0 --log-stats 1 --se 1 --se-lr 1e-3 --se-epochs 100  --props-lambda 0.3   --target-kl 0.03 --props-target-kl 0.1
python ppo_props_continuous.py -f results_rl -s b_2 --env-id HalfCheetah-v4 --total-timesteps 2000000 --eval-freq 10 -lr 0.0001 --num-steps 1024 --update-epochs 10 --anneal-lr 1 -b 2 --props 1 --props-num-steps 512 -props-lr 0.001 --props-update-epochs 16 --props-num-minibatches 16 --props-clip-coef 0.3 --props-anneal-lr 0 --log-stats 1 --se 1 --se-lr 1e-3 --se-epochs 100  --props-lambda 0.3   --target-kl 0.03 --props-target-kl 0.05
python ppo_props_continuous.py -f results_rl -s b_2 --env-id Swimmer-v4 --total-timesteps 1000000 --eval-freq 10 -lr 0.001 --num-steps 2048 --update-epochs 10 --anneal-lr 1 -b 2 --props 1 --props-num-steps 1024 -props-lr 1e-05 --props-update-epochs 16 --props-num-minibatches 16 --props-clip-coef 0.3 --props-anneal-lr 0 --log-stats 1 --se 1 --se-lr 1e-3 --se-epochs 100  --props-lambda 0.1   --target-kl 0.03 --props-target-kl 0.03
python ppo_props_continuous.py -f results_rl -s b_2 --env-id Ant-v4 --total-timesteps 4000000 --eval-freq 10 -lr 0.0001 --num-steps 2048 --update-epochs 10 --anneal-lr 1 -b 2 --props 1 --props-num-steps 256 -props-lr 0.001 --props-update-epochs 16 --props-num-minibatches 16 --props-clip-coef 0.3 --props-anneal-lr 0 --log-stats 1 --se 1 --se-lr 1e-3 --se-epochs 100  --props-lambda 0.1   --target-kl 0.03 --props-target-kl 0.03
python ppo_props_continuous.py -f results_rl -s b_2 --env-id Humanoid-v4 --total-timesteps 6000000 --eval-freq 10 -lr 0.0001 --num-steps 8192 --update-epochs 10 --anneal-lr 1 -b 2 --props 1 --props-num-steps 256 -props-lr 0.0001 --props-update-epochs 16 --props-num-minibatches 32 --props-clip-coef 0.3 --props-anneal-lr 0 --log-stats 1 --se 1 --se-lr 1e-3 --se-epochs 100  --props-lambda 0.1   --target-kl 0.03 --props-target-kl 0.1
