muon_search_space = {
    'muon_lr': {
        'min': 1e-5,
        'max': 1e-1,
        'log': True,
        'type': 'float',
    },
    'adam_lr': {
        'min': 1e-5,
        'max': 1e-2,
        'log': True,
        'type': 'float',
    },
    'muon_weight_decay': {
        'min': 1e-5,
        'max': 1e-1,
        'log': True,
        'type': 'float',
    },
    'adam_weight_decay': {
        'min': 1e-5,
        'max': 1e-1,
        'log': True,
        'type': 'float',
    },
    'batch_size': 128,
}

adamw_search_space = {
    'lr': {
        'min': 1e-5,
        'max': 1e-2,
        'log': True,
        'type': 'float',
    },
    'weight_decay': {
        'min': 1e-5,
        'max': 1e-1,
        'log': True,
        'type': 'float',
    },
    'batch_size': 128,
}

signumliearlr_search_space = {
    'lr_max': {
        'min': 1e-3,
        'max': 1.0,
        'log': True,
        'type': 'float',
    },
    'lr_min': {
        'min': 1e-6,
        'max': 1e-3,
        'log': True,
        'type': 'float',
    },
    'schedule_iters': {
        'min': 0.2,
        'max': 0.9,
        'log': False,
        'type': 'float',
    },
    'weight_decay': {
        'min': 1e-5,
        'max': 1e-1,
        'log': True,
        'type': 'float',
    },
    'momentum': {
        'min': 0.8,
        'max': 0.99,
        'log': False,
        'type': 'float',
    },
    'batch_size': 128,
}

signum_search_space = {
    'lr': {
        'min': 1e-5,
        'max': 1e-2,
        'log': True,
        'type': 'float',
    },
    'weight_decay': {
        'min': 1e-5,
        'max': 1e-1,
        'log': True,
        'type': 'float',
    },
    'momentum': {
        'min': 0.8,
        'max': 0.99,
        'log': False,
        'type': 'float',
    },
    'batch_size': 128,
}

softsignum_search_space = {
    'lr': {
        'min': 1e-5,
        'max': 1e-2,
        'log': True,
        'type': 'float',
    },
    'weight_decay': {
        'min': 1e-5,
        'max': 1e-1,
        'log': True,
        'type': 'float',
    },
    'momentum': {
        'min': 0.8,
        'max': 0.99,
        'log': False,
        'type': 'float',
    },
    'tmin': {
        'min': 1.0,
        'max': 5.0,
        'log': False,
        'type': 'float',
    },
    'tmax': {
        'min': 15.0,
        'max': 30.0,
        'log': False,
        'type': 'float',
    },
    'warmup_iters': {
        'min': 0.1,
        'max': 0.9,
        'log': False,
        'type': 'float',
    },
    'batch_size': 128,
}

softsignum_auto_search_space = {
    'lr': {
        'min': 1e-5,
        'max': 1e-2,
        'log': True,
        'type': 'float',
    },
    'weight_decay': {
        'min': 1e-5,
        'max': 1e-1,
        'log': True,
        'type': 'float',
    },
    'momentum': {
        'min': 0.8,
        'max': 0.99,
        'log': False,
        'type': 'float',
    },
    'warmup_iters': {
        'min': 0.6,
        'max': 0.9,
        'log': False,
        'type': 'float',
    },
    'batch_size': 128,
}

softsignum_const_search_space = {
    'lr': {
        'min': 1e-5,
        'max': 1e-2,
        'log': True,
        'type': 'float',
    },
    'weight_decay': {
        'min': 1e-5,
        'max': 1e-1,
        'log': True,
        'type': 'float',
    },
    'momentum': {
        'min': 0.8,
        'max': 0.99,
        'log': False,
        'type': 'float',
    },
    'tmax': {
        'min': 4.0,
        'max': 100.0,
        'log': False,
        'type': 'float',
    },
    'warmup_iters': {
        'min': 0.6,
        'max': 0.9,
        'log': False,
        'type': 'float',
    },
    'batch_size': 128,
}

signumsgd_search_space = {
    'sign_lr': {
        'min': 1e-5,
        'max': 1e-2,
        'log': True,
        'type': 'float',
    },
    'sgd_lr': {
        'min': 1e-5,
        'max': 1e-2,
        'log': True,
        'type': 'float',
    },
    'weight_decay': {
        'min': 1e-5,
        'max': 1e-1,
        'log': True,
        'type': 'float',
    },
    'sign_momentum': {
        'min': 0.8,
        'max': 0.99,
        'log': False,
        'type': 'float',
    },
    'sgd_momentum': {
        'min': 0.8,
        'max': 0.99,
        'log': False,
        'type': 'float',
    },
    'warmup_iters': {
        'min': 1_000,
        'max': 15_000,
        'log': True,
        'type': 'int',
    },
    'batch_size': 128,
}

adam_search_space = {
    'lr': {
        'min': 1e-5,
        'max': 1e-2,
        'log': True,
        'type': 'float',
    },
    'weight_decay': {
        'min': 1e-5,
        'max': 1e-1,
        'log': True,
        'type': 'float',
    },
    'eps': {
        'min': 1e-20,
        'max': 1e-3,
        'log': True,
        'type': 'float',
    },
    'batch_size': 128,
}

adameps_search_space = {
    'lr': {
        'min': 1e-5,
        'max': 1e-2,
        'log': True,
        'type': 'float',
    },
    'weight_decay': {
        'min': 1e-5,
        'max': 1e-1,
        'log': True,
        'type': 'float',
    },
    'eps': {
        'min': 1e-20,
        'max': 1e-3,
        'log': True,
        'type': 'float',
    },
    'batch_size': 128,
}

adamwclip_search_space = {
    'lr': {
        'min': 1e-5,
        'max': 1e-2,
        'log': True,
        'type': 'float',
    },
    'clip': {
        'min': 0.5,
        'max': 2.0,
        'log': False,
        'type': 'float',
    },
    'weight_decay': {
        'min': 1e-5,
        'max': 1e-1,
        'log': True,
        'type': 'float',
    },
    'batch_size': 128,
}

adamwbetas_search_space = {
    'lr': {
        'min': 1e-5,
        'max': 1e-2,
        'log': True,
        'type': 'float',
    },
    'clip': {
        'min': 0.5,
        'max': 2.0,
        'log': False,
        'type': 'float',
    },
    'weight_decay': {
        'min': 1e-5,
        'max': 1e-1,
        'log': True,
        'type': 'float',
    },
    'beta1': {
        'min': 0.8,
        'max': 0.99,
        'log': False,
        'type': 'float',
    },
    'beta2': {
        'min': 1e-5,
        'max': 0.9999,
        'log': True,
        'type': 'float',
    },
    'eps': {
        'min': 1e-20,
        'max': 1e-3,
        'log': True,
        'type': 'float',
    },
    'batch_size': 128,
}

palm2_search_space = {
    'lr': {
        'min': 1e-5,
        'max': 1e-2,
        'log': True,
        'type': 'float',
    },
    'weight_decay': {
        'min': 1e-5,
        'max': 1e-1,
        'log': True,
        'type': 'float',
    },
    'beta1': {
        'min': 0.8,
        'max': 0.99,
        'log': False,
        'type': 'float',
    },
    'beta2': {
        'min': 0.9,
        'max': 0.9999,
        'log': True,
        'type': 'float',
    },
    'beta2_final': {
        'min': 0.9,
        'max': 0.9999,
        'log': True,
        'type': 'float',
    },
    'batch_size': 128,
}

beta_scheduling_search_space = {
    'lr': {
        'min': 1e-5,
        'max': 1e-2,
        'log': True,
        'type': 'float',
    },
    'weight_decay': {
        'min': 1e-5,
        'max': 1e-1,
        'log': True,
        'type': 'float',
    },
    'warmup_iters': {
        'min': 1_000,
        'max': 15_000,
        'log': True,
        'type': 'int',
    },
    'batch_size': 128,
}

eps_scheduling_search_space = {
    'lr': {
        'min': 1e-5,
        'max': 1e-2,
        'log': True,
        'type': 'float',
    },
    'weight_decay': {
        'min': 1e-5,
        'max': 1e-1,
        'log': True,
        'type': 'float',
    },
    'warmup_iters': {
        'min': 1_000,
        'max': 15_000,
        'log': True,
        'type': 'int',
    },
    'batch_size': 128,
}

sgd_search_space = {
    'lr': {
        'min': 1e-4, # SGD often needs a larger LR than Adam
        'max': 1e-1,
        'log': True,
        'type': 'float',
    },
    'weight_decay': {
        'min': 1e-5,
        'max': 1e-2, # WD for SGD is often a bit smaller
        'log': True,
        'type': 'float',
    },
    'momentum': {
        'min': 0.85,
        'max': 0.99,
        'log': False,
        'type': 'float',
    },
    'batch_size': 128,
}

sgdlinearlr_search_space = {
    'lr_max': {
        'min': 1e-3,
        'max': 1.0,
        'log': True,
        'type': 'float',
    },
    'lr_min': {
        'min': 1e-6,
        'max': 1e-3,
        'log': True,
        'type': 'float',
    },
    'schedule_iters': {
        'min': 0.2,
        'max': 0.9,
        'log': False,
        'type': 'float',
    },
    'weight_decay': {
        'min': 1e-5,
        'max': 1e-2, # WD for SGD is often a bit smaller
        'log': True,
        'type': 'float',
    },
    'momentum': {
        'min': 0.85,
        'max': 0.99,
        'log': False,
        'type': 'float',
    },
    'batch_size': 128,
}

sgdcosineannealinglr_search_space = {
    'lr': {
        'min': 1e-3,
        'max': 1.0,
        'log': True,
        'type': 'float',
    },
    'eta_min': {
        'min': 1e-6,
        'max': 1e-3,
        'log': True,
        'type': 'float',
    },
    'schedule_iters': {
        'min': 0.2,
        'max': 0.9,
        'log': False,
        'type': 'float',
    },
    'weight_decay': {
        'min': 1e-5,
        'max': 1e-2, # WD for SGD is often a bit smaller
        'log': True,
        'type': 'float',
    },
    'momentum': {
        'min': 0.85,
        'max': 0.99,
        'log': False,
        'type': 'float',
    },
    'batch_size': 128,
}

sgdlinearlrclip_search_space = {
    **sgdlinearlr_search_space, # Inherit from the new SGD space
    'clip': {
        'min': 0.5,
        'max': 5.0, # Can allow a wider clip range for SGD
        'log': False,
        'type': 'float',
    },
}

sgdclip_search_space = {
    **sgd_search_space, # Inherit from the new SGD space
    'clip': {
        'min': 0.5,
        'max': 5.0, # Can allow a wider clip range for SGD
        'log': False,
        'type': 'float',
    },
}

softsignumsgd_search_space = {
    'lr': {
        'min': 1e-5,
        'max': 1e-2,
        'log': True,
        'type': 'float',
    },
    'weight_decay': {
        'min': 1e-5,
        'max': 1e-1,
        'log': True,
        'type': 'float',
    },
    'momentum': {
        'min': 0.8,
        'max': 0.99,
        'log': False,
        'type': 'float',
    },
    'tmin': {
        'min': 1.0,
        'max': 5.0,
        'log': False,
        'type': 'float',
    },
    'tmax': {
        'min': 15.0,
        'max': 30.0,
        'log': False,
        'type': 'float',
    },
    'warmup_iters': {
        'min': 0.4,
        'max': 0.9,
        'log': False,
        'type': 'float',
    },
    'only_sign_iters': {
        'min': 0.1,
        'max': 0.6,
        'log': False,
        'type': 'float',
    },
    'batch_size': 128,
}

softsignumsgd_auto_search_space = {
    'lr': {
        'min': 1e-5,
        'max': 1e-2,
        'log': True,
        'type': 'float',
    },
    'weight_decay': {
        'min': 1e-5,
        'max': 1e-1,
        'log': True,
        'type': 'float',
    },
    'momentum': {
        'min': 0.8,
        'max': 0.99,
        'log': False,
        'type': 'float',
    },
    'warmup_iters': {
        'min': 0.4,
        'max': 0.9,
        'log': False,
        'type': 'float',
    },
    'only_sign_iters': {
        'min': 0.1,
        'max': 0.6,
        'log': False,
        'type': 'float',
    },
    'batch_size': 128,
}

softsignumsgd_const_search_space = {
    'lr': {
        'min': 1e-5,
        'max': 1e-2,
        'log': True,
        'type': 'float',
    },
    'weight_decay': {
        'min': 1e-5,
        'max': 1e-1,
        'log': True,
        'type': 'float',
    },
    'momentum': {
        'min': 0.8,
        'max': 0.99,
        'log': False,
        'type': 'float',
    },
    'tmax': {
        'min': 4.0,
        'max': 100.0,
        'log': False,
        'type': 'float',
    },
    'warmup_iters': {
        'min': 0.4,
        'max': 0.9,
        'log': False,
        'type': 'float',
    },
    'only_sign_iters': {
        'min': 0.1,
        'max': 0.6,
        'log': False,
        'type': 'float',
    },
    'batch_size': 128,
}

signum_plus_sgd_search_space = {
    'lr': {
        'min': 1e-5,
        'max': 1e-2,
        'log': True,
        'type': 'float',
    },
    'weight_decay': {
        'min': 1e-5,
        'max': 1e-1,
        'log': True,
        'type': 'float',
    },
    'momentum': {
        'min': 0.8,
        'max': 0.99,
        'log': False,
        'type': 'float',
    },
    'only_sign_iters': {
        'min': 0.1,
        'max': 0.6,
        'log': False,
        'type': 'float',
    },
    'batch_size': 128,
}

signum_plus_sgd_linearLR_search_space = {
    'lr_max': {
        'min': 1e-3,
        'max': 1.0,
        'log': True,
        'type': 'float',
    },
    'lr_min': {
        'min': 1e-6,
        'max': 1e-3,
        'log': True,
        'type': 'float',
    },
    'schedule_iters': {
        'min': 0.2,
        'max': 0.9,
        'log': False,
        'type': 'float',
    },
    'weight_decay': {
        'min': 1e-5,
        'max': 1e-1,
        'log': True,
        'type': 'float',
    },
    'momentum': {
        'min': 0.8,
        'max': 0.99,
        'log': False,
        'type': 'float',
    },
    'only_sign_iters': {
        'min': 0.1,
        'max': 0.6,
        'log': False,
        'type': 'float',
    },
    'batch_size': 128,
}

search_spaces_map = {
    'AdamW': adamw_search_space,
    'Muon': muon_search_space,
    'Signum': signum_search_space,
    'SignumLinearLR': signumliearlr_search_space,
    'Signum_decoupled_wd': signum_search_space,
    'Signum_decoupled_wd_LinearLR': signumliearlr_search_space,
    'SoftSignum': softsignum_search_space,
    'SignumSGD': signumsgd_search_space,
    'Adam': adam_search_space,
    'AdamEps': adameps_search_space,
    'AdamWClip': adamwclip_search_space,
    'SGD': sgd_search_space,
    'SGDLinearLR': sgdlinearlr_search_space,
    'SGDLinearLR+Clip': sgdlinearlrclip_search_space,
    'SGDCosineAnnealingLR': sgdcosineannealinglr_search_space,
    'SGDClip': sgdclip_search_space,
    'AdamWBetas': adamwbetas_search_space,
    'AdamPaLM2': palm2_search_space,
    'AdamBetaScheduling': beta_scheduling_search_space,
    'AdamEpsScheduling': eps_scheduling_search_space,
    'SignumDL': signum_search_space,
    'SignumDLNesterov': signum_search_space,
    'SoftSignumPT_not_decoupled_wd': softsignum_search_space,
    'SoftSignumPT_not_decoupled_wd-auto': softsignum_auto_search_space,
    'SoftSignumPT_not_decoupled_wd-const': softsignum_const_search_space,
    'SoftSignumPT': softsignum_search_space,
    'SoftSignumPT-auto': softsignum_auto_search_space,
    'SoftSignumPT-const': softsignum_const_search_space,
    'SoftSignumSGD': softsignumsgd_search_space,
    'SoftSignumSGD-auto': softsignumsgd_auto_search_space,
    'SoftSignumSGD-const': softsignumsgd_const_search_space,
    'SoftSignumSGD_not_decoupled_wd': softsignumsgd_search_space,
    'SoftSignumSGD_not_decoupled_wd-auto': softsignumsgd_auto_search_space,
    'SoftSignumSGD_not_decoupled_wd-const': softsignumsgd_const_search_space,
    'Signum+SGD': signum_plus_sgd_search_space,
    'Signum+SGD_not_decoupled_wd': signum_plus_sgd_search_space,
    'Signum+SGD_with_LinearLR': signum_plus_sgd_linearLR_search_space
}
