GPU_NAME=$(nvidia-smi --query-gpu=name --format=csv,noheader | head -n1)
echo "Current GPU: $GPU_NAME"

export CUDA_LAUNCH_BLOCKING=1

python scripts/benchmark_gemv.py --in_size 4096 --out_size 11008 --gpu "$GPU_NAME" --batch_size 1
python scripts/benchmark_gemv.py --in_size 4096 --out_size 11008 --gpu "$GPU_NAME" --batch_size 4
python scripts/benchmark_gemv.py --in_size 4096 --out_size 11008 --gpu "$GPU_NAME" --batch_size 16
python scripts/benchmark_gemv.py --in_size 4096 --out_size 11008 --gpu "$GPU_NAME" --batch_size 64
python scripts/benchmark_gemv.py --in_size 4096 --out_size 11008 --gpu "$GPU_NAME" --batch_size 256

python scripts/benchmark_gemv.py --in_size 4096 --out_size 14336 --gpu "$GPU_NAME" --batch_size 1
python scripts/benchmark_gemv.py --in_size 4096 --out_size 14336 --gpu "$GPU_NAME" --batch_size 4
python scripts/benchmark_gemv.py --in_size 4096 --out_size 14336 --gpu "$GPU_NAME" --batch_size 16
python scripts/benchmark_gemv.py --in_size 4096 --out_size 14336 --gpu "$GPU_NAME" --batch_size 64
python scripts/benchmark_gemv.py --in_size 4096 --out_size 14336 --gpu "$GPU_NAME" --batch_size 256

python scripts/benchmark_gemv.py --in_size 5120 --out_size 17920 --gpu "$GPU_NAME" --batch_size 1
python scripts/benchmark_gemv.py --in_size 5120 --out_size 17920 --gpu "$GPU_NAME" --batch_size 4
python scripts/benchmark_gemv.py --in_size 5120 --out_size 17920 --gpu "$GPU_NAME" --batch_size 16
python scripts/benchmark_gemv.py --in_size 5120 --out_size 17920 --gpu "$GPU_NAME" --batch_size 64
python scripts/benchmark_gemv.py --in_size 5120 --out_size 17920 --gpu "$GPU_NAME" --batch_size 256