CUDA_VISIBLE_DEVICES=2 python main.py \
--model_path  ./Llama-2-7b-hf/  \
--model_name Llama-2-7b \
--output_dir ./log/Llama-2-7b-w6a6 \
--wbits 6 \
--input_bits 6 \
--input_mode static \
--output_bits 6 \
--output_mode static \
--kv_group_size 128 \
--kv_mode static \
--mse_init \
--pre_rotate \
--down_online_had \
--qk_online_had \
--set_prefixed_tokens \
--eval_ppl \
--eval_tasks  piqa,arc_easy,arc_challenge,hellaswag,winogrande \
--save_quant_dir ./pre_quantized_models/Llama-2-7b-w6a6