CUDA_VISIBLE_DEVICES=2 python main.py \
--model /PATH/TO/llama-13b-hf --eval_ppl --save_dir ./fake_quant_model/llama-13b-w4a4 \
--epochs 20 --output_dir ./log/llama-13b-w4a4 \
--wbits 16 --abits 16 --lwc --let --aug_loss --tasks hendrycksTest,piqa,arc_easy,arc_challenge,boolq,hellaswag,winogrande