cd ..

GPU=0
qbit=4
prune_ratio=0.1

CUDA_VISIBLE_DEVICES=${GPU} python main.py \
        --model /path/to/llama/model/ \
        --eval_dataset wikitext2 \
        --rotate \
        --rotate_mode hadamard \
        --w_rtn \
        --w_clip \
        --nsamples 128 \
        --cal_dataset wikitext2 \
        --w_bits $qbit \
        --v_bits $qbit \
        --k_bits $qbit \
        --a_bits $qbit \
        --save_qmodel_path quarot \
        --prune_ratio $prune_ratio \
        --prune_method sparsegpt \
        --prune_before_quant \
