python neurl_dwex_ensemble_vanilla_fqi.py \
    --experiment "StaQ-mujoco-hopper" \
    --lr 0.0001 \
    --rwd-scale 1.0 \
    --target-type "hard" \
    --mode "min" \
    --kl-weight 10.0 \
    --init-eps 0.05 \
    --final-eps 0.05 \
    --end-decay 1000000 \
    --max-trans 5000000 \
    --eval-interval 100000 \
    --batch-size 256 \
    --env-name Hopper-v4 \
    --seed $1 \
