torchrun --nproc_per_node 4 -m training.main \
    --train-data ../openclip_data/coco_gt_171cls.csv \
    --train-num-samples 965036 \
    --lr 0.000005 \
    --warmup 100 \
    --force-quick-gelu \
    --dataset-type csv \
    --batch-size 32 \
    --precision amp \
    --workers 4 \
    --model  ViT-L-14 \
    --lock-text \
    --zeroshot-frequency 1 \
    --save-frequency 5 \
    --epoch 5 \
    --pretrained  openai \
    --ade-val ../openclip_data/ade_gt_150cls_val