# config/model.yaml for EMG

# 指定要调用的构造函数
_target_: models.waver.ChannelVisionTransformer

###############################################################################
# 1) Wavelet‑based front‑end
###############################################################################
in_ch: 12                 # Number of input channels (e.g. 12‑lead ECG)
max_level: 4              # Wavelet decomposition depth for multi‑scale features
wave_kernel_size: 24      # 1‑D kernel length to capture time‑frequency patterns
wavelet_names: ['db6', 'sym4', 'bior3.5', 'coif3']  # Bases suited to non‑stationary signals
use_separate_channel: true  # Depthwise filtering: one wavelet filter per channel

###############################################################################
# 2) FFN & CrossScale‑CAFFN
###############################################################################
ffn_ratio: 4.0            # Expansion ratio in the feed‑forward network
ffn_kernel_size: 5        # Depthwise‑conv kernel in CAFFN (captures motor‑unit patterns)
ffn_drop: 0.1             # Dropout rate to mitigate over‑fitting

###############################################################################
# 3) Patch parameters
###############################################################################
patch_width: 64           # Temporal width of each patch

###############################################################################
# 4) Transformer & masking
###############################################################################
embed_dim: 512            # Token embedding dimension
depth: 12                 # Number of Transformer blocks
num_heads: 16             # Attention heads
mlp_ratio: 4.0            # MLP expansion ratio
drop_path: 0.15           # Stochastic‑depth rate
attention_type: "default" # Attention variant used in CustomAttentionBlock
masking_ratio: 0.7        # MAE‑style mask fraction during pre‑training
importance_ratio: 0.6     # Weight of spectral energy in mask scoring
use_masking: true         # Enable masking for self‑supervised training

###############################################################################
# 5) Rotary position encoding
###############################################################################
max_seq_len: 2048         # Maximum sequence length handled by RoPE