CUDA_VISIBLE_DEVICES=0 python merge_lora.py \
--lora_model_name_or_path /xx/models/llama2-allabcd-13b-lora \
--base_model_name_or_path meta-llama/Llama-2-13b-hf \
--output_dir /xx/models/llama2-allabcd-13b-lora-merged

cp /xx/models/llama2-gsm-13b-lora-merged/tokenizer* /xx/models/llama2-allabcd-13b-lora-merged
#/data/outs/axo/13b-gsm8k-all-r8