CUDA_VISIBLE_DEVICES=3
accelerate launch NLU/examples/text-classification/run_glue.py \
--model_name_or_path microsoft/deberta-v3-base \
--task_name mrpc \
--apply_lora --lora_type svd \
--target_rank 1   --lora_r 8   \
--reg_orth_coef 0.0 \
--init_warmup 600 --final_warmup 1800 --mask_interval 1 \
--beta1 0.9 --beta2 0.85 \
--lora_module query,key,value,intermediate,layer.output,attention.output \
--lora_alpha 32 \
--do_train --do_eval --max_seq_length 320 \
--per_device_train_batch_size 32 --learning_rate 5e-4 \
--num_train_epochs 3 --warmup_ratio 0.1 \
--cls_dropout 0.0 --weight_decay 0.02 \
--evaluation_strategy steps --eval_steps 300 \
--save_strategy steps --save_steps 3000 \
--logging_steps 100 \
--report_to tensorboard \
--final_cr 0.3 \
--seed 1 \
--riemannian 'stiefel' \
--root_output_dir ./output/debertav3-base/mrpc \
--overwrite_output_dir
