#!/bin/bash
# 自动选择显存小于1000MB的 GPU 并执行指定脚本

# 使用方式：
#   ./auto_gpu_run.sh your_script.py [args...]
# 例如：
#   ./auto_gpu_run.sh train.py --epochs 10

# 阈值（单位 MB）
THRESHOLD=1000

# 获取可用 GPU 数
GPU_COUNT=$(nvidia-smi --query-gpu=index --format=csv,noheader | wc -l)

SELECTED_GPU=-1

for ((i=0; i<$GPU_COUNT; i++)); do
    # 查询显存占用情况（MiB）
    USED_MEM=$(nvidia-smi --query-gpu=memory.used --format=csv,noheader,nounits | sed -n "$((i+1))p")
    TOTAL_MEM=$(nvidia-smi --query-gpu=memory.total --format=csv,noheader,nounits | sed -n "$((i+1))p")
    FREE_MEM=$((TOTAL_MEM - USED_MEM))
    
    echo "GPU $i: Used=${USED_MEM}MB / Total=${TOTAL_MEM}MB / Free=${FREE_MEM}MB"

    # 判断显存是否小于阈值
    if [ "$USED_MEM" -lt "$THRESHOLD" ]; then
        SELECTED_GPU=$i
        break
    fi
done

if [ "$SELECTED_GPU" -eq -1 ]; then
    echo "❌ 未找到显存占用低于 ${THRESHOLD}MB 的 GPU。"
    exit 1
fi

echo "✅ 选择 GPU: $SELECTED_GPU (显存占用低于 ${THRESHOLD}MB)"
export CUDA_VISIBLE_DEVICES=$SELECTED_GPU

# 执行用户指定的脚本
echo "🚀 正在执行：$@"
"$@"


# bash run_10111.sh run_gen_reverse.sh