python -m experiments.make_lm_outputs --model_name "Qwen/Qwen3-4B" --data_name 'hellaswag' --c_type 'base' --batch_size 32 --seed 0 --do_sample False --log_dir "./logs/qwen34_arc_test_csft" --data_type "val" --mode "base" --query_peft_dir "/mnt/home/chaeyun-jang/CSFT/logs/qwen3-4_hellaswag_csft/checkpoint-600"
python -m experiments.make_lm_outputs --model_name "Qwen/Qwen3-8B" --data_name 'hellaswag' --c_type 'base' --batch_size 32 --seed 0 --do_sample False --log_dir "./logs/qwen38_arc_test_csft" --data_type "val" --mode "base" --query_peft_dir "/mnt/home/chaeyun-jang/CSFT/logs/qwen3-8_hellaswag_csft/checkpoint-600"