#!/bin/bash -l
#SBATCH --nodes=5
#SBATCH --ntasks-per-node=1
#SBATCH --cpus-per-task=288
#SBATCH --gres=gpu:4
#SBATCH --mem=478g
#SBATCH -t 2-00:00:00
#SBATCH -A account
#SBATCH -p partition
#SBATCH --output="./logs/sbatch_pretrain.txt"
#SBATCH --error="./logs/sbatch_pretrain.err"

nodes=( $( scontrol show hostnames $SLURM_JOB_NODELIST ) )
nodes_array=($nodes)
head_node=${nodes_array[0]}
ips=$(srun --nodes=1 --ntasks=1 -w "$head_node" hostname --ip-address)
ips_array=($ips)
head_node_ip=${ips_array[0]}
rdvz_port=$(expr 10000 + $(echo -n $SLURM_JOBID | tail -c 4))

srun ../pretrain.sh $head_node_ip $rdvz_port
