eval "$(conda shell.bash hook)"
conda activate uniq

# CUDA_VISIBLE_DEVICES=0 python -u scripts/train_UNIQ.py \
# --env_name=halfcheetah-expert-v2 --batch_size=1024 \
# --disc_lr=1e-4 --hidden_size=256 --num_layers=3 \
# --critic_lr=3e-4 --value_lr=3e-4 \
# --v_update=rkl_loss --alpha=3.0 --noise_std=0.1 \
# --tau=0.001 --actor_temperature=5.0 --reward_gap=5.0 \
# --clip_threshold=0.6 --weight_decay=0.01 \
# --sample_random_times=0 --exp_name=dump_exp \
# --bad_name_list=random,medium \
# --bad_size_list=5000,5000 \
# --mixed_name_list=random,medium,expert \
# --mixed_size_list=500000,500000,100000 \
# --is_good_list=0,0,1 \
# --is_bad_list=1,1,0 \
# --use_wandb

# CUDA_VISIBLE_DEVICES=0 python -u scripts/train_UNIQ.py \
# --env_name=ant-expert-v2 --batch_size=1024 \
# --disc_lr=1e-4 --hidden_size=256 --num_layers=3 \
# --critic_lr=1e-4 --value_lr=3e-5 \
# --v_update=rkl_loss --alpha=1.0 --noise_std=0.1 \
# --tau=0.01 --actor_temperature=0.5 --reward_gap=3.0 \
# --clip_threshold=0.5 --weight_decay=0.03 \
# --sample_random_times=0 --exp_name=dump_exp \
# --bad_name_list=random,medium \
# --bad_size_list=5000,5000 \
# --mixed_name_list=random,medium,expert \
# --mixed_size_list=500000,500000,100000 \
# --is_good_list=0,0,1 \
# --is_bad_list=1,1,0 \
# --use_wandb

# CUDA_VISIBLE_DEVICES=0 python -u scripts/train_UNIQ.py \
# --env_name=hopper-expert-v2 --batch_size=1024 \
# --disc_lr=1e-4 --hidden_size=256 --num_layers=3 \
# --critic_lr=3e-4 --value_lr=3e-4 \
# --v_update=rkl_loss --alpha=5.0 --noise_std=0.1 \
# --tau=0.003 --actor_temperature=1.0 --reward_gap=2.0 \
# --clip_threshold=0.5 --weight_decay=0.03 \
# --sample_random_times=0 --exp_name=dump_exp \
# --bad_name_list=random,medium \
# --bad_size_list=5000,5000 \
# --mixed_name_list=random,medium,expert \
# --mixed_size_list=500000,500000,100000 \
# --is_good_list=0,0,1 \
# --is_bad_list=1,1,0 \
# --use_wandb

# CUDA_VISIBLE_DEVICES=0 python -u scripts/train_UNIQ.py \
# --env_name=walker2d-expert-v2 --batch_size=1024 \
# --disc_lr=1e-4 --hidden_size=256 --num_layers=3 \
# --critic_lr=3e-4 --value_lr=3e-4 \
# --v_update=rkl_loss --alpha=7.0 --noise_std=0.1 \
# --tau=0.001 --actor_temperature=0.5 --reward_gap=5.0 \
# --clip_threshold=0.6 --weight_decay=0.01 \
# --sample_random_times=0 --exp_name=dump_exp \
# --bad_name_list=random,medium \
# --bad_size_list=5000,5000 \
# --mixed_name_list=random,medium,expert \
# --mixed_size_list=500000,500000,100000 \
# --is_good_list=0,0,1 \
# --is_bad_list=1,1,0 \
# --use_wandb

