#!/bin/bash
#SBATCH --job-name=iter_flap    # 作业在调度系统中的作业名为myFirstJob
#SBATCH --partition=lvjq            # 作业提交的指定队列
#SBATCH --nodes=1                   # 申请节点数为1,如果作业不能跨节点(MPI)运行, 申请的节点数应不超过1
#SBATCH --ntasks-per-node=1         # 每节点任务数，GPU任务不需要修改
#SBATCH --cpus-per-task=3           # V100一张卡默认配置3个CPU核心，gpuB一张卡默认配置12个CPU核心,MIG资源一张卡默认配置6个CPU核心(根据卡数自行调整)
#SBATCH --gres=gpu:1                # 申请GPU卡数
#SBATCH -o %J.out                   # 脚本执行的输出将被保存在当 %J.out文件下，%j表示作业号
#SBATCH -e %J.err                   # 脚本执行的错误日志将被保存在当 %J.err文件下，%j表示作业号

module load anaconda3               # 加载相关依赖
source activate come             # 如果已经在命令行中激活对应环境，提交脚本时需注释此行，推荐保留此行在base环境下提交任务

PYTHON=~/.conda/envs/come/bin/python

MODEL=/seu_nvme/ogai/models/Meta-Llama-3.1-8B-Instruct
DATA_DIR=/seu_nvme/ogai/datasets/

OUT_BASE=./iter_flap_outputs/

CALIB_DATASET=mmlu                # 或 c4 / mmlu
NSAMPLES=128                      # 校准样本数

for ratio in 0.5; do
  OUT_DIR="${OUT_BASE}/flap_iter_r${ratio}"

  echo "==============================="
  echo "Pruning with target_pruning_ratio = ${ratio}"
  echo "Output dir: ${OUT_DIR}"
  echo "==============================="

  $PYTHON /TO/MY/PATH/code/Understanding_Performance_Collapse/TALE/iterative_flap_prun.py \
  --model_name_or_path ${MODEL} \
  --output_root ${OUT_DIR} \
  --calib_dataset ${CALIB_DATASET} \
  --data_dir ${DATA_DIR} \
  --num_calib_sample ${NSAMPLES} \
  --seqlen 512 \
  --metrics WIFV \
  --wanda_sp \
  --start_keep_ratio 1.0 \
  --end_keep_ratio 0.5 \
  --keep_ratio_step 0.02 \
  --min_save_prune_percent 3 \
  --fp16
done
