python main.py --env appleDoor_a_1 --dense_reward --num_agents 1 --algo PPO --frames 500000 --save_interval
python main.py --env appleDoor_a_2 --dense_reward --num_agents 1 --algo PPO --frames 500000 --save_interval
python main.py --env appleDoor_b_1 --dense_reward --num_agents 1 --algo PPO --frames 500000 --save_interval
python main.py --env appleDoor_b_2 --dense_reward --num_agents 1 --algo PPO --frames 500000 --save_interval