compute_environment: LOCAL_MACHINE
debug: false
distributed_type: MULTI_GPU  # 如果你有多张 GPU；如果只用一张，改为 'NO'
downcast_bf16: 'no'
machine_rank: 0
main_training_function: main
mixed_precision: 'no'        # 可改为 'fp16' 或 'bf16' 启用混合精度
num_machines: 1
num_processes: 8          # 改为你想用的 GPU 数量，如 1, 2, 4
rdzv_backend: static
same_network: true
tpu_env: []
tpu_use_cluster: false
tpu_use_sudo: false
use_cpu: false