optimizer.lr:
  - 1e-1
  - 1e-2
  - 1e-3

model.nheads:
  - 1
  - 2
  - 4
  - 8
  - 16
  - 32
  - 64
  - 128
  - 256
  - 512
  - 1024
  - 2048
  - 4096
  - 8192
  - 16384

data.dim:
  - 4
  - 8
  - 16
  - 32
  - 64
  - 128

optimizer.weight_decay:
  - 0