#!/bin/bash
#SBATCH --job-name=TALE_flap_important    # 作业在调度系统中的作业名为myFirstJob
#SBATCH --partition=lvjq            # 作业提交的指定队列
#SBATCH --nodes=1                   # 申请节点数为1,如果作业不能跨节点(MPI)运行, 申请的节点数应不超过1
#SBATCH --ntasks-per-node=1         # 每节点任务数，GPU任务不需要修改
#SBATCH --cpus-per-task=3           # V100一张卡默认配置3个CPU核心，gpuB一张卡默认配置12个CPU核心,MIG资源一张卡默认配置6个CPU核心(根据卡数自行调整)
#SBATCH --gres=gpu:1                # 申请GPU卡数
#SBATCH -o %J.out                   # 脚本执行的输出将被保存在当 %J.out文件下，%j表示作业号
#SBATCH -e %J.err                   # 脚本执行的错误日志将被保存在当 %J.err文件下，%j表示作业号

module load anaconda3               # 加载相关依赖
source activate amoaballm             # 如果已经在命令行中激活对应环境，提交脚本时需注释此行，推荐保留此行在base环境下提交任务

PYTHON=~/.conda/envs/amoaballm/bin/python

MODEL_PATH=/TO/MY/PATH/code/Understanding_Performance_Collapse/pruned_models/shortgpt/llama3-8b-0.7/Meta-Llama-3.1-8B-Instruct_shortgpt_22
# /TO/MY/PATH/code/Understanding_Performance_Collapse/pruned_models/shortgpt/llama3-8b/Meta-Llama-3.1-8B-Instruct_shortgpt_16

$PYTHON /TO/MY/PATH/code/Understanding_Performance_Collapse/methods/flap.py \
    --model_name_or_path ${MODEL_PATH} \
    --output_dir /TO/MY/PATH/code/Understanding_Performance_Collapse/pruned_models/shortgpt/flap_importance/llama3-8b-70% \
    --calib_dataset mmlu \
    --data_dir /seu_nvme/ogai/datasets \
    --num_calib_sample 20 \
    --seqlen 512 \
    --metrics WIFV \
    --structure AL-AM \
    --remove_heads 128 \
    --only_importance \
