python main.py --model $1 --temperature 0.6 --eval_coremark True \
--pass_k 5 --self_correct True --do_analyze True --correct_round 3 \
--use_mask True --mask_stage coremark_baseline