#!/bin/bash


deepspeed --include localhost:0,1 --master_port 9501 train.py \
    --model "meta-llama/Llama-3.2-1B-Instruct" \
    --data_split train5 \
    --batch_size 16 \
    --grad_acc 1 \
    --num_epochs 300 \
    --loss digit_base \
    --max_length 2048
