torchrun --nproc_per_node=4 run_glue.py \
         --wandb_offline 1 \
         --do_train \
         --do_eval \
         --gradient_accumulation_steps 1 \
         --output_dir ./output/model \
         --overwrite_output_dir \
         --logging_steps 10 \
         --logging_dir ./output/log \
         --evaluation_strategy epoch \
         --save_strategy epoch \
         --warmup_ratio 0.06 \
         --max_grad_norm 1000.0 \
         --weight_decay 0.0 \
         --shared_uv 1 \
         --shared_dim 768 \
         --model_name_or_path roberta-base \
         --per_device_train_batch_size 64 \
         --max_seq_length 128 \
         --mode elora \
         --lora_r 512 \
         --init_type 1 \
         --d_init_type 94 \
         --seed 42 \
         --task_name mrpc \
         --num_train_epochs 30 \
         --classifier_lr 2e-2 \
         --learning_rate 1e-2
