python neurl_dwex_ensemble_vanilla_fqi.py \
    --experiment "StaQ-mujoco" \
    --lr 0.0001 \
    --rwd-scale 10.0 \
    --target-type "hard" \
    --mode "min" \
    --kl-weight 10.0 \
    --init-eps 0.05 \
    --final-eps 0.05 \
    --end-decay 1000000 \
    --max-trans 5000000 \
    --eval-interval 100000 \
    --batch-size 256 \
    --env-name $1 \
    --seed $2 \
