
SFT_DATASET="bird_train_full_qwen"
LABELED_FILE="data/labeled/bird_train_pipeline_label.jsonl"
SFT_CONFIG="sft_config"  

python -m src.sft.prepare_classifier_sft_data \
    --sft_dataset ${SFT_DATASET} \
    --labeled_file ${LABELED_FILE}

export NCCL_P2P_DISABLE=1
export NCCL_IB_DISABLE=1

export CUDA_VISIBLE_DEVICES=4,5,6,7
torchrun --nproc_per_node=4 --master_port=29500 \
    -m src.sft.qwen_classifier_sft \
    --sft_config ${SFT_CONFIG} \
    --sft_dataset ${SFT_DATASET}

echo -e "\n\n----------------- Inference example of Qwen Classifier SFT -----------------\n"
python -m src.sft.qwen_classifier_inference
