CODE=scripts/main.py
DATA=/path/to/dataset
DS_CONFIG=ds_configs/bf16/zero_stage2_config.json

CUDA_VISIBLE_DEVICES=0 torchrun --nproc_per_node=1 --nnodes=1 $CODE \
    --data_dir $DATA \
    --use_deepspeed True --deepspeed_config $DS_CONFIG --precision bf16 \
    --gradient_accumulation_steps 4 \
    --seq_len 4096 --batch_size 1 --append_bos True --model_name_or_path colm_40L_32H_16-16_air\