TRAIN:
  OPTIMIZER_NAME: adamw
QUANT:
  P:
    ENABLE: False
    BITS: 8
    GROUP_SIZE: 64
    SCALE_TYPE:
      DEFAULT: group
      DEFAULT_ONLY: True
    QUANT_TYPE:
      DEFAULT: linear
      DEFAULT_ONLY: True
    ROUND_TYPE: sr
  G:
    ENABLE: False
  M:
    ENABLE: True
    BITS: 4
    GROUP_SIZE: 128
    SCALE_TYPE:
      DEFAULT: group
      DEFAULT_ONLY: True
    QUANT_TYPE:
      DEFAULT: nonlinear
      DEFAULT_ONLY: True
    ROUND_TYPE: real-nearest
  SQM:
    ENABLE: True
    BITS: 4
    GROUP_SIZE: 512
    SCALE_TYPE:
      DEFAULT: rank1-group
      DEFAULT_ONLY: True
    QUANT_TYPE:
      DEFAULT: power-2
      DEFAULT_ONLY: True
    ROUND_TYPE: real-nearest