python -m rl.main --log_root_dir ./logs --wandb True --prefix 07.14.BASELINE.v12 --max_global_step 60000000 --env sawyer-peg-insertion-obstacle-v2 --gpu 1 --max_episode_step 250 --evaluate_interval 10000 --entropy_loss_coef 1e-3 --buffer_size 1000000 --num_batches 1 --debug False --rollout_length 10000 --batch_size 256 --clip_param 0.2 --rl_activation relu --algo sac --seed 1236 --ctrl_reward 1e-2 --reward_type sparse --comment Baseline --start_steps 10000 --actor_num_hid_layers 2 --env_debug False --log_freq 1000 --log_interval 1000 --alpha 1.0 --vis_replay True --task_level easy --plot_type 3d --success_reward 150. --reward_scale 10.  --is_train False

# python -m rl.main --log_root_dir ./logs --wandb True --prefix 07.15.SAC.PLANNER.AUGMENTED.piecewise0.5.ac_range0.5.scale0.2.reuse.sparse.v12 --env sawyer-peg-insertion-obstacle-v2 --gpu 1 --max_episode_step 250 --num_batches 1 --debug False --batch_size 256 --rl_activation relu --algo sac --seed 1235 --reward_type sparse --comment Sanity Check --log_freq 1000 --log_interval 1000 --planner_integration True --allow_manipulation_collision True --alpha 1.0 --reuse_data_type random --action_range 0.5 --ac_rl_maximum 0.5 --ac_rl_minimum -0.5 --invalid_planner_rew -0.0 --extended_action False --stochastic_eval True --find_collision_free True --use_double_planner False --vis_replay True --task_level easy --use_cum_rew True --plot_type 3d --use_smdp_update True --ac_space_type piecewise --use_discount_meta True --step_size 0.02 --success_reward 150.0 --add_curr_rew True --discount_factor 0.99 --max_reuse_data 15 --min_reuse_span 20 --reward_scale 0.2 --is_train False
