torchrun --nproc-per-node=8 ddp.py