#!/bin/bash
#SBATCH --job-name=flap_width    # 作业在调度系统中的作业名
#SBATCH --partition=lvjq         # 作业提交的指定队列
#SBATCH --nodes=1                # 申请节点数为1
#SBATCH --ntasks-per-node=1      # 每节点任务数，GPU任务不需要修改
#SBATCH --cpus-per-task=3        # CPU 核心数
#SBATCH --gres=gpu:1             # 申请GPU卡数
#SBATCH -o %J.out                # 标准输出日志
#SBATCH -e %J.err                # 错误输出日志

module load anaconda3            # 加载 Anaconda
source activate come             # 激活你的 conda 环境（如果已经在环境中，提交时可注释）

PYTHON=~/.conda/envs/come/bin/python

# 需要根据你实际情况修改的三个路径：
MODEL=/seu_nvme/ogai/models/Meta-Llama-3.1-8B-Instruct
DATA_DIR=/seu_nvme/ogai/datasets
FLAP_SCRIPT=/TO/MY/PATH/code/Understanding_Performance_Collapse/TALE/flap_prun.py

# 输出目录基准前缀
OUT_BASE=./flap_baseline_outputs

# 校准数据与 FLAP 相关超参
CALIB_DATASET=mmlu          # 可选：wikitext2 / c4 / mmlu
NUM_CALIB_SAMPLE=32         # 用于计算重要性的校准样本数
SEQLEN=512                  # 校准序列长度（与脚本默认一致）
METRICS=WIFV                # IFV / WIFV / WIFN
SEED=42

# target_keep_ratio 表示“大约保留的参数量比例”
# 这里 0.5 对应你的 baseline：保留 ~50% 参数量对应的 heads+neurons
for ratio in 0.9 0.8 0.7 0.6 0.5; do
  OUT_DIR="${OUT_BASE}/flap_width_keep_${ratio}"

  echo "==============================="
  echo "FLAP width-only pruning baseline"
  echo "Target keep ratio (weight-level) = ${ratio}"
  echo "Output dir: ${OUT_DIR}"
  echo "==============================="

  $PYTHON ${FLAP_SCRIPT} \
    --model_name_or_path "${MODEL}" \
    --output_dir "${OUT_DIR}" \
    --calib_dataset "${CALIB_DATASET}" \
    --data_dir "${DATA_DIR}" \
    --num_calib_sample ${NUM_CALIB_SAMPLE} \
    --seqlen ${SEQLEN} \
    --metrics ${METRICS} \
    --target_keep_ratio ${ratio} \
    --seed ${SEED} \
    --fp16

done
