CUDA_VISIBLE_DEVICES=1 python ../Trains/train_prefim.py \
--env_name='SafeDriverBlocking' --max_episode_length=1000 --segment_length=1000 \
--seed=0 --num_training_step=1000000 \
--gamma=0.99 --cost_gamma=0.99 \
--number_layers=3 --hidden_units_actor=256 --hidden_units_critic=256 \
--number_layers_clfs=2 --hidden_units_clfs=64 \
--coef_ent=0.0001 --reward_factor=1.0 --env_cost_limit=0.0 \
--lr_actor=0.0001 --lr_critic=0.0001 --lr_penalty=0.01 --clip_eps=0.2 \
--num_eval_episodes=100 --eval_num_envs=10 --max_grad_norm=1.0 --epoch_ppo=160 \
--buffer_size=50000 --eval_interval=50000 --num_envs=10  \
--batch_size=4096 --epoch_clfs=5000 \
--wandb_log=False \
--alpha=0.1 --clip_dev=15.0 \
--n_ensemble=1 --mixup=False \
--aug_state=False --imp_sampl=False --pos_weight=1.0 --strat_schedule='novel' \
--start_bad=0 --warm_start_steps=0 --debug=True --encode_action=False \
--hash_type='SimHash' --k=11 --over_sample=False --hinge_coeff=0.0 --total_queries=500 \

    

