sh scripts/run_glp_mult_uneven.sh --dpo_type 'rdpo' --feature_type 'swapped' --step_size 0.1 --reg_coef 0.1 --eval_metric argmax --ipo_grad_type 'linear' --param_limit 5 --exp_step_size 0.01 --dpo_num_iters 1000 --use_closed_form True --deterministic_ratio_list '[1,1]' --weighted_batches False --lamba 0 --val_deterministic_ratio_list '[1,1]' --use_theory True