python evaluate.py  \
    --tasks GQC \
    --prompt_type fs\
    --hf_model lmsys/vicuna-33b-v1.3 \
    --enable_code_execution