## GSM
python -m experiments.make_lm_outputs --model_name "meta-llama/Llama-3.1-8B-Instruct" --data_name 'gsm' --c_type 'base' --batch_size 32 --seed 0 --do_sample False --log_dir "./logs/llama8_gsm_zs" --data_type "test" 
python -m experiments.make_lm_outputs --model_name "meta-llama/Llama-3.2-3B-Instruct" --data_name 'gsm' --c_type 'base' --batch_size 32 --seed 0 --do_sample False --log_dir "./logs/llama3_gsm_zs" --data_type "test"

python -m experiments.make_lm_outputs --model_name "meta-llama/Llama-3.1-8B-Instruct" --data_name 'gsm' --c_type 'base' --batch_size 32 --seed 0 --do_sample True --log_dir "./logs/llama8_gsm_seed_0" --data_type "train" --suffix False
python -m experiments.make_lm_outputs --model_name "meta-llama/Llama-3.1-8B-Instruct" --data_name 'gsm' --c_type 'base' --batch_size 32 --seed 1 --do_sample True --log_dir "./logs/llama8_gsm_seed_1" --data_type "train" --suffix False
python -m experiments.make_lm_outputs --model_name "meta-llama/Llama-3.1-8B-Instruct" --data_name 'gsm' --c_type 'base' --batch_size 32 --seed 2 --do_sample True --log_dir "./logs/llama8_gsm_seed_2" --data_type "train" --suffix False
python -m experiments.make_lm_outputs --model_name "meta-llama/Llama-3.1-8B-Instruct" --data_name 'gsm' --c_type 'base' --batch_size 32 --seed 3 --do_sample True --log_dir "./logs/llama8_gsm_seed_3" --data_type "train" --suffix False
python -m experiments.make_lm_outputs --model_name "meta-llama/Llama-3.1-8B-Instruct" --data_name 'gsm' --c_type 'base' --batch_size 32 --seed 4 --do_sample True --log_dir "./logs/llama8_gsm_seed_4" --data_type "train" --suffix False
python -m experiments.make_lm_outputs --model_name "meta-llama/Llama-3.1-8B-Instruct" --data_name 'gsm' --c_type 'base' --batch_size 32 --seed 5 --do_sample True --log_dir "./logs/llama8_gsm_seed_5" --data_type "train" --suffix False
python -m experiments.make_lm_outputs --model_name "meta-llama/Llama-3.1-8B-Instruct" --data_name 'gsm' --c_type 'base' --batch_size 32 --seed 6 --do_sample True --log_dir "./logs/llama8_gsm_seed_6" --data_type "train" --suffix False
python -m experiments.make_lm_outputs --model_name "meta-llama/Llama-3.1-8B-Instruct" --data_name 'gsm' --c_type 'base' --batch_size 32 --seed 7 --do_sample True --log_dir "./logs/llama8_gsm_seed_7" --data_type "train" --suffix False
python -m experiments.make_lm_outputs --model_name "meta-llama/Llama-3.1-8B-Instruct" --data_name 'gsm' --c_type 'base' --batch_size 32 --seed 8 --do_sample True --log_dir "./logs/llama8_gsm_seed_8" --data_type "train" --suffix False 
python -m experiments.make_lm_outputs --model_name "meta-llama/Llama-3.1-8B-Instruct" --data_name 'gsm' --c_type 'base' --batch_size 32 --seed 9 --do_sample True --log_dir "./logs/llama8_gsm_seed_9" --data_type "train" --suffix False

python -m experiments.make_lm_outputs --model_name "meta-llama/Llama-3.2-3B-Instruct" --data_name 'gsm' --c_type 'base' --batch_size 32 --seed 0 --do_sample True --log_dir "./logs/llama3_gsm_seed_0" --data_type "train" --suffix False
python -m experiments.make_lm_outputs --model_name "meta-llama/Llama-3.2-3B-Instruct" --data_name 'gsm' --c_type 'base' --batch_size 32 --seed 1 --do_sample True --log_dir "./logs/llama3_gsm_seed_1" --data_type "train" --suffix False
python -m experiments.make_lm_outputs --model_name "meta-llama/Llama-3.2-3B-Instruct" --data_name 'gsm' --c_type 'base' --batch_size 32 --seed 2 --do_sample True --log_dir "./logs/llama3_gsm_seed_2" --data_type "train" --suffix False
python -m experiments.make_lm_outputs --model_name "meta-llama/Llama-3.2-3B-Instruct" --data_name 'gsm' --c_type 'base' --batch_size 32 --seed 3 --do_sample True --log_dir "./logs/llama3_gsm_seed_3" --data_type "train" --suffix False
python -m experiments.make_lm_outputs --model_name "meta-llama/Llama-3.2-3B-Instruct" --data_name 'gsm' --c_type 'base' --batch_size 32 --seed 4 --do_sample True --log_dir "./logs/llama3_gsm_seed_4" --data_type "train" --suffix False
python -m experiments.make_lm_outputs --model_name "meta-llama/Llama-3.2-3B-Instruct" --data_name 'gsm' --c_type 'base' --batch_size 32 --seed 5 --do_sample True --log_dir "./logs/llama3_gsm_seed_5" --data_type "train" --suffix False
python -m experiments.make_lm_outputs --model_name "meta-llama/Llama-3.2-3B-Instruct" --data_name 'gsm' --c_type 'base' --batch_size 32 --seed 6 --do_sample True --log_dir "./logs/llama3_gsm_seed_6" --data_type "train" --suffix False
python -m experiments.make_lm_outputs --model_name "meta-llama/Llama-3.2-3B-Instruct" --data_name 'gsm' --c_type 'base' --batch_size 32 --seed 7 --do_sample True --log_dir "./logs/llama3_gsm_seed_7" --data_type "train" --suffix False
python -m experiments.make_lm_outputs --model_name "meta-llama/Llama-3.2-3B-Instruct" --data_name 'gsm' --c_type 'base' --batch_size 32 --seed 8 --do_sample True --log_dir "./logs/llama3_gsm_seed_8" --data_type "train" --suffix False
python -m experiments.make_lm_outputs --model_name "meta-llama/Llama-3.2-3B-Instruct" --data_name 'gsm' --c_type 'base' --batch_size 32 --seed 9 --do_sample True --log_dir "./logs/llama3_gsm_seed_9" --data_type "train" --suffix False

## MMLU
python -m experiments.make_lm_outputs --model_name "meta-llama/Llama-3.1-8B-Instruct" --data_name 'mmlu' --c_type 'base' --batch_size 32 --seed 0 --do_sample False --log_dir "./logs/llama3_mmlu_zs" --data_type "test" 
python -m experiments.make_lm_outputs --model_name "meta-llama/Llama-3.1-8B-Instruct" --data_name 'mmlu' --c_type 'base' --batch_size 32 --seed 0 --do_sample False --log_dir "./logs/llama3_mmlu_zs_nt" --data_type "test" --think_mode False
python -m experiments.make_lm_outputs --model_name "meta-llama/Llama-3.2-3B-Instruct" --data_name 'mmlu' --c_type 'base' --batch_size 32 --seed 0 --do_sample False --log_dir "./logs/llama3_mmlu_zs" --data_type "test" 
python -m experiments.make_lm_outputs --model_name "meta-llama/Llama-3.2-3B-Instruct" --data_name 'mmlu' --c_type 'base' --batch_size 32 --seed 0 --do_sample False --log_dir "./logs/llama3_mmlu_zs_nt" --data_type "test" --think_mode False

python -m experiments.make_lm_outputs --model_name "meta-llama/Llama-3.2-3B-Instruct" --data_name 'mmlu' --c_type 'base' --batch_size 32 --seed 0 --do_sample True --log_dir "./logs/llama8_mmlu_seed_0" --data_type "train" --suffix False --think_mode False
python -m experiments.make_lm_outputs --model_name "meta-llama/Llama-3.2-3B-Instruct" --data_name 'mmlu' --c_type 'base' --batch_size 32 --seed 1 --do_sample True --log_dir "./logs/llama8_mmlu_seed_1" --data_type "train" --suffix False --think_mode False
python -m experiments.make_lm_outputs --model_name "meta-llama/Llama-3.2-3B-Instruct" --data_name 'mmlu' --c_type 'base' --batch_size 32 --seed 2 --do_sample True --log_dir "./logs/llama8_mmlu_seed_2" --data_type "train" --suffix False --think_mode False
python -m experiments.make_lm_outputs --model_name "meta-llama/Llama-3.2-3B-Instruct" --data_name 'mmlu' --c_type 'base' --batch_size 32 --seed 3 --do_sample True --log_dir "./logs/llama8_mmlu_seed_3" --data_type "train" --suffix False --think_mode False
python -m experiments.make_lm_outputs --model_name "meta-llama/Llama-3.2-3B-Instruct" --data_name 'mmlu' --c_type 'base' --batch_size 32 --seed 4 --do_sample True --log_dir "./logs/llama8_mmlu_seed_4" --data_type "train" --suffix False --think_mode False
python -m experiments.make_lm_outputs --model_name "meta-llama/Llama-3.2-3B-Instruct" --data_name 'mmlu' --c_type 'base' --batch_size 32 --seed 5 --do_sample True --log_dir "./logs/llama8_mmlu_seed_5" --data_type "train" --suffix False --think_mode False
python -m experiments.make_lm_outputs --model_name "meta-llama/Llama-3.2-3B-Instruct" --data_name 'mmlu' --c_type 'base' --batch_size 32 --seed 6 --do_sample True --log_dir "./logs/llama8_mmlu_seed_6" --data_type "train" --suffix False --think_mode False
python -m experiments.make_lm_outputs --model_name "meta-llama/Llama-3.2-3B-Instruct" --data_name 'mmlu' --c_type 'base' --batch_size 32 --seed 7 --do_sample True --log_dir "./logs/llama8_mmlu_seed_7" --data_type "train" --suffix False --think_mode False
python -m experiments.make_lm_outputs --model_name "meta-llama/Llama-3.2-3B-Instruct" --data_name 'mmlu' --c_type 'base' --batch_size 32 --seed 8 --do_sample True --log_dir "./logs/llama8_mmlu_seed_8" --data_type "train" --suffix False --think_mode False
python -m experiments.make_lm_outputs --model_name "meta-llama/Llama-3.2-3B-Instruct" --data_name 'mmlu' --c_type 'base' --batch_size 32 --seed 9 --do_sample True --log_dir "./logs/llama8_mmlu_seed_9" --data_type "train" --suffix False --think_mode False

python -m experiments.make_lm_outputs --model_name "meta-llama/Llama-3.1-8B-Instruct" --data_name 'mmlu' --c_type 'base' --batch_size 32 --seed 0 --do_sample True --log_dir "./logs/llama3_mmlu_seed_0" --data_type "train" --suffix False --think_mode False
python -m experiments.make_lm_outputs --model_name "meta-llama/Llama-3.1-8B-Instruct" --data_name 'mmlu' --c_type 'base' --batch_size 32 --seed 1 --do_sample True --log_dir "./logs/llama3_mmlu_seed_1" --data_type "train" --suffix False --think_mode False
python -m experiments.make_lm_outputs --model_name "meta-llama/Llama-3.1-8B-Instruct" --data_name 'mmlu' --c_type 'base' --batch_size 32 --seed 2 --do_sample True --log_dir "./logs/llama3_mmlu_seed_2" --data_type "train" --suffix False --think_mode False
python -m experiments.make_lm_outputs --model_name "meta-llama/Llama-3.1-8B-Instruct" --data_name 'mmlu' --c_type 'base' --batch_size 32 --seed 3 --do_sample True --log_dir "./logs/llama3_mmlu_seed_3" --data_type "train" --suffix False --think_mode False
python -m experiments.make_lm_outputs --model_name "meta-llama/Llama-3.1-8B-Instruct" --data_name 'mmlu' --c_type 'base' --batch_size 32 --seed 4 --do_sample True --log_dir "./logs/llama3_mmlu_seed_4" --data_type "train" --suffix False --think_mode False
python -m experiments.make_lm_outputs --model_name "meta-llama/Llama-3.1-8B-Instruct" --data_name 'mmlu' --c_type 'base' --batch_size 32 --seed 5 --do_sample True --log_dir "./logs/llama3_mmlu_seed_5" --data_type "train" --suffix False --think_mode False
python -m experiments.make_lm_outputs --model_name "meta-llama/Llama-3.1-8B-Instruct" --data_name 'mmlu' --c_type 'base' --batch_size 32 --seed 6 --do_sample True --log_dir "./logs/llama3_mmlu_seed_6" --data_type "train" --suffix False --think_mode False
python -m experiments.make_lm_outputs --model_name "meta-llama/Llama-3.1-8B-Instruct" --data_name 'mmlu' --c_type 'base' --batch_size 32 --seed 7 --do_sample True --log_dir "./logs/llama3_mmlu_seed_7" --data_type "train" --suffix False --think_mode False
python -m experiments.make_lm_outputs --model_name "meta-llama/Llama-3.1-8B-Instruct" --data_name 'mmlu' --c_type 'base' --batch_size 32 --seed 8 --do_sample True --log_dir "./logs/llama3_mmlu_seed_8" --data_type "train" --suffix False --think_mode False
python -m experiments.make_lm_outputs --model_name "meta-llama/Llama-3.1-8B-Instruct" --data_name 'mmlu' --c_type 'base' --batch_size 32 --seed 9 --do_sample True --log_dir "./logs/llama3_mmlu_seed_9" --data_type "train" --suffix False --think_mode False