python neurl_dwex_ensemble_vanilla_fqi.py \
    --experiment "StaQ-minatar" \
    --rwd-scale 200.0 \
    --lr 0.0001 \
    --target-type "hard" \
    --mode "mean" \
    --kl-weight 20.0 \
    --init-eps 0.05 \
    --final-eps 0.05 \
    --end-decay 1000000 \
    --max-trans 5000000 \
    --eval-interval 100000 \
    --batch-size 256 \
    --env-name $1 \
    --seed $2 \
