CUDA_VISIBLE_DEVICES=3 python main.py \
--model_path ./Meta-Llama-3-8B  \
--model_name Llama-3-8b \
--output_dir ./log/Llama-3-8b-w8a8 \
--wbits 8 \
--input_bits 8 \
--input_mode static \
--output_bits 8 \
--output_mode static \
--kv_group_size 128 \
--kv_mode static \
--mse_init \
--pre_rotate \
--down_online_had \
--qk_online_had \
--set_prefixed_tokens \
--eval_ppl \
--eval_tasks  piqa,arc_easy,arc_challenge,hellaswag,winogrande \
--save_quant_dir ./pre_quantized_models/Llama-3-8b-w8a8