python train.py \
    --student_model EleutherAI/pythia-410m \
    --teacher_model stabilityai/stablelm-zephyr-3b \
    --data_path data/stablelm \
    --output_dir logs/stablelm-tvd \
    --batch_size 8 \
    --num_epochs 5 \
    --loss_type tvd