# Compare_RNN 方法验证测试（Validation tests）

该目录提供轻量化脚本，用于验证 `Compare_RNN/methods` 中 RNN 实现的正确性与公平性。

脚本说明：
- `eprop_gradcheck_detach.py`：在 `decay_lambda=0` 时，将 `StandardEPropRNN` 的逐步梯度与 stop-gradient (detach) 的 autograd 参考对齐，并比较最终权重更新。
- `bptt_weighted_gradcheck.py`：验证 BPTT/TBPTT 在加权时间步与时间归一化设置下，与 autograd 参考更新一致（包含 MSE 与 CE 两种损失）。
- `fptt_chunk_gradcheck.py`：在关闭 oracle/regularizer 的条件下，对比 `StrictFPTTClassifier` 的分块更新与参考的 chunked BPTT 实现。
- `fptt_seq_regression_gradcheck.py`：验证 `StrictFPTTClassifier`（`label_mode="all"`）与 `StrictFPTTRegressor` 的分块更新，是否与 autograd 参考一致（oracle/regularizer 关闭）。
- `fairness_checks.py`：检查 `ClassOracleBuffer` 更新逻辑、`FPTTRegularizer` 损失/步进公式，以及不同方法的共享初始化是否一致。
- `lyapunov_clip_tbptt_tests.py`：补盲测试：Lyapunov（torch-QR vs numpy-QR）一致性、BPTT 梯度裁剪阈值/更新幅度一致性、TBPTT chunk detach 与 autograd 参考对齐。
- `validate_all_methods.py`：更全面的多轮验证（`TorchBPTTRNN` / `StandardEPropRNN` / `TorchLocalRuleRNN` / `StrictFPTTClassifier`），并保存曲线图（参数差异曲线、oracle chunk-loss 曲线）。

使用方式：
```
cd D:\PKU\Compare_RNN
python validation_tests\eprop_gradcheck_detach.py
python validation_tests\bptt_weighted_gradcheck.py
python validation_tests\fptt_chunk_gradcheck.py
python validation_tests\fptt_seq_regression_gradcheck.py
python validation_tests\fairness_checks.py
python validation_tests\lyapunov_clip_tbptt_tests.py
python validation_tests\validate_all_methods.py --epochs 12
```

注意：
- 全部测试默认在 CPU 上运行，保证可复现。
- 每个脚本都会打印 max absolute diff，超出阈值会抛 `AssertionError`。
- `validate_all_methods.py` 会把图保存到 `Compare_RNN/validation_tests/plots/`。
- 常用参数：`--skip-toy`（跳过 toy 曲线）、`--toy-epochs N`（toy 轮数）、`--out-root PATH`（自定义输出目录）。

结果解读（每个脚本失败意味着什么）：
- `eprop_gradcheck_detach.py`：E-Prop 逐步梯度或权重更新与 stop-gradient 的 autograd 参考不一致。
- `bptt_weighted_gradcheck.py`：BPTT/TBPTT 的加权时间步或时间归一化逻辑与 autograd 参考不一致。
- `fptt_chunk_gradcheck.py`：关闭 oracle/regularizer 后，Strict FPTT 的分块更新与 chunked BPTT 参考不一致。
- `fptt_seq_regression_gradcheck.py`：seq2seq（`label_mode=all`）或回归的分块更新与 autograd 参考不一致。
- `fairness_checks.py`：oracle buffer 更新、正则项公式或参数初始化对齐出现问题。
- `validate_all_methods.py`：多轮迭代下参数漂移超过阈值；toy 曲线仅作为 sanity check，不是严格证明。

为什么这些测试可以作为正确性证据：
- 使用 autograd 作为“参考真值”，严格对齐 BPTT/TBPTT 与 FPTT 分块更新。
- 通过极限/特例（如 `decay_lambda=0`、`parts=1`）将复杂规则退化到已知基线。
- 固定随机种子并在 CPU 上运行，确保误差可复现、可定位。
