CUDA_VISIBLE_DEVICES=0,1 python -m torch.distributed.launch  --nproc_per_node 2 --master_port 29590 main_pretrain.py \
    --batch_size 256 --accum_iter 8 --epochs 100 --warmup_epochs 5 --blr 1.5e-4 --weight_decay 0.05 --pin_mem \
    --model unip_vit_small_patch16 --last_heads 16  \
    --infpre_path /path/to/infpre \
    --in1k_path /path/to/in1k \
    --coco_path /path/to/coco \
    --use_coco --use_in1k --per_cls_num 200 --rgb_gray \
    --teacher_path /path/to/mae-large/checkpoint \
    --teacher_model vit_large \
    --intermediate 18 \
    --output_dir=/your_output_dir/mae_large_layer18_distill_unip_small_100ep_infmix \
    --log_dir=/your_log_dir/mae_large_layer18_distill_unip_small_100ep_infmix