export CUDA_VISIBLE_DEVICES=0,1,2,3

accelerate launch --num_processes=4 --num_machines=1 --mixed_precision=bf16 --dynamo_backend=no main.py\
    --model_name="EleutherAI/pythia-70m-deduped"\
    --strong_model_name="EleutherAI/pythia-70m-deduped"\
    --is_easy_to_hard=no\
    --dataset_name="arc"\
    --adaboost_rounds=2\
    --num_epochs=2\
    --learning_rate=5e-5\
    --train_batch_size=6\
    --pred_batch_size=4\
    --num_proc=4\
    --model_max_length=512\
    --is_token_based_error=yes\
    --is_weight_by_token=yes\
    --is_completion_only=no\
    --probability_bias=0\
    --token_prob_window_size=1\
    --logits_top_k=256\
    --is_combine_probs=yes\
    --is_top_k_pooling=no\
    --test_limit=100\
    --w2s_folder="./"\
    --grp_name=mcding\