#!/bin/bash

# 设置 Hugging Face 镜像
export HF_ENDPOINT=https://hf-mirror.com

work_dir=/home/linyeli/cqj/ICML2026/ProcessBench/code
cd ${work_dir}

# 运行 uncertainty drop 错误检测评估
# 使用 vLLM 方式（默认，更快）
python run_eval_uncertainty_drop.py \
    --model_path Qwen/Qwen2.5-3B-Instruct \
    --configs gsm8k \
    --output_dir ./outputs \
    --ema_span 5.0 \
    --drop_k 5 \
    --uncertainty_measures entropy evidence length_norm_logprob mean_logprob perplexity confidence

# 或者使用 Transformers 方式（更准确，但更慢）
# python run_eval_uncertainty_drop.py \
#     --model_path Qwen/Qwen2.5-3B-Instruct \
#     --configs gsm8k \
#     --output_dir ./outputs \
#     --ema_span 5.0 \
#     --drop_k 5 \
#     --use_transformers \
#     --uncertainty_measures entropy evidence length_norm_logprob mean_logprob perplexity confidence

