
python batch_inference_rm_general_preference.py \
--pretrain  \
--dataset    \
--max_samples 100000 \
--general_preference_tau 0.1 \
--micro_batch_size 3 \
--max_len 2048 \
--value_head_dim 2 \
--is_custom_dataset \
--is_general_preference \
