CUDA_VISIBLE_DEVICES=0,1 python3 -m torch.distributed.launch --master_port=1459 \
    --nproc_per_node=2 \
    --use_env train.py \
    --model=rbonn18 \
    --data-dir=[DATA_PATH] \
    --batch-size=256 \
    --lr=5e-4 \
    --epochs=200 \
    --weight-decay=1e-5 \
    --opt=adam \
    --sched=cosine \
    --lr-cycle-decay=1.0 \