CUDA_VISIBLE_DEVICES=0 torchrun --nproc_per_node 1 eval.py \
    --ckpt_dir ../data/weights/ \
    --llm_model 7B\
    --tokenizer_path ../data/weights/tokenizer.model \
    --data_root ../data \
    --caption_file ../data/captions.json \
    --adapter_path ./LaVIN-7B-lite/checkpoint-19.pth \
    --adapter_type attn \
    --adapter_dim 8 \
    --adapter_scale 1 \
    --prompt_format QCM-ALE \
    --max_batch_size 16 \
    --max_seq_len 512 \
    --split test \
    --n_prompt 6 \
    --temperature 10.\
    --visual_adapter_type router \
    --bits 4bit \
    --cpu_load \
    --lwc \
    --quant_resume ./LaVIN-7B-lite/quant_params/llama-7b-w4a16g128_modify.pth \
    --scaling_resume ./pretrain/7b/checkpoint-1.pth \
    --start_layer 5 \
