# Compare_RNN / Compare_CNN：可复现的序列学习规则对比基准

## 1. 项目简介

**Compare_RNN**（核心）：
- 统一 RNN 形状/接口契约，提供训练/评估/增益扫描（gain scan）与 Lyapunov 诊断。
- 对比方法：
  - `Local Rule`：在线更新（支持 FPTT surrogate 软标签）。
  - `BPTT` / `TBPTT-k`：基线反传与截断反传。
  - `E-Prop`（RFLO 近似）：显式 eligibility traces + learning signal。
  - `Strict FPTT`：chunk schedule + oracle buffer + proximal regularizer。

**Compare_CNN**（可选）：将同一套对比思路扩展到 ConvRNN（图像/事件数据）。

---

## 2. 目录结构与关键文件（代码地图）

核心引擎（RNN）：
- `Compare_RNN/task/common/sequence_core.py`：训练/评估/扫描、BPTT/TBPTT、Local-rule、结果写盘、Lyapunov（Benettin QR）。

方法实现（RNN）：
- `Compare_RNN/methods/standard_eprop.py`：E-Prop/RFLO（eligibility traces、learning signal、梯度裁剪）。
- `Compare_RNN/methods/strict_fptt.py`：Strict FPTT（chunk schedule、oracle buffer、regularizer、梯度裁剪）。
- `Compare_RNN/methods/shared_rnn_utils.py`：共享初始化/参数拷贝/公平性工具。

验证脚本（实现正确性证据）：
- `Compare_RNN/validation_tests/*.py`：把实现与 autograd 参考对齐（含 TBPTT/FPTT/e-prop/local-rule）。

一键跑实验与汇总：
- `tools/run_experiments.py`：批量运行一套任务并把输出保存到 `plots/runner/`。
- `tools/aggregate_summaries.py`：多 seed 的 `*_summary.csv` 汇总成 mean±std。

第三方参考代码（默认当作 vendor，不建议大改）：
- `Compare_RNN/eligibility_propagation-master/`、`Compare_RNN/eprop-PyTorch-main/`、`Compare_RNN/FPTT-main/`、`Compare_RNN/OTTT-SNN-main/`

---

## 3. 环境依赖与安装

推荐环境：
- Python：3.10+（建议）
- PyTorch：建议 2.x（根据你的 CUDA/CPU 环境安装）

安装（核心依赖）：
```bash
pip install -r requirements.txt
```

说明：
- Windows/Linux/macOS 都可跑；GPU 不是必须（validation tests 默认 CPU 也可跑）。
- `requirements.txt` 只列出主线实验需要的依赖；事件数据（DVS/SHD）额外依赖见“数据集准备”。

---

## 4. 数据集准备（不泄漏协议）

本仓库默认遵循：**train→(train/val split) 用于选超参/早停；test 仅用于最终一次报告**。

常见数据集：
- MNIST / CIFAR-10：优先使用 `torchvision` 自动下载到 `./data/`；也支持本地缓存文件。
- UCI HAR：首次运行会自动下载并缓存到 `data/uci_har/uci_har.npz`。
- PTB Char/Word：`Compare_RNN/task/common/sequence_core.py` 支持从 HuggingFace 或直接 URL 下载。
- WikiText-2 Char：默认通过 HuggingFace `datasets` 下载；也支持用户提供本地 `wiki.*.raw`。

事件数据（可选）：
- SHD / DVS-*：需要 `tonic`；DVS-CIFAR10 的 `.aedat4` 解析还需要 `aedat`。

---

## 5. 快速开始（可复制命令）

### 5.1 一键跑一组实验（推荐）

```bash
python tools/run_experiments.py --suite all --epochs 100 --scan-epochs 10 --batch-size 64 --hidden 128 --seed 42 --include-dvs-cifar10
```

只跑 RNN：
```bash
python tools/run_experiments.py --suite rnn --epochs 100 --scan-epochs 10 --batch-size 64 --hidden 128 --seed 42
```

### 5.2 单独跑一个分类任务：Row-Sequential MNIST
```bash
python Compare_RNN/task/classification/row_mnist.py --epochs 50 --scan-epochs 5 --batch-size 64 --hidden 128 --seed 42 --plot-path plots/runner/rnn_row_mnist/exp.png
```

### 5.3 单独跑一个回归任务：Adding Task
```bash
python Compare_RNN/task/regression/adding_task.py --epochs 50 --scan-epochs 5 --batch-size 64 --hidden 128 --seed 42 --plot-path plots/runner/rnn_adding_task/exp.png
```

### 5.4 单独跑一个语言模型任务：PTB Char LM
```bash
python Compare_RNN/task/lm/ptb_char.py --epochs 100 --scan-epochs 5 --batch-size 64 --hidden 128 --seed 42 --ptb-block-size 80 --ptb-steps-per-epoch 200 --ptb-val-steps 60 --eval-every 5 --plot-path plots/runner/rnn_ptb_char/exp.png
```

---

## 6. 复现实验（Reproducibility）

### 6.1 随机性与 seed

- 所有任务脚本都暴露 `--seed`。
- 核心引擎在任务入口会统一调用 `set_global_seed(seed)`（random/numpy/torch + cudnn deterministic 设置）。

### 6.2 实现正确性证据（validation tests）

在仓库根目录运行：
```bash
python -m compileall Compare_RNN Compare_CNN
python Compare_RNN/validation_tests/eprop_gradcheck_detach.py
python Compare_RNN/validation_tests/bptt_weighted_gradcheck.py
python Compare_RNN/validation_tests/fptt_chunk_gradcheck.py
python Compare_RNN/validation_tests/fptt_seq_regression_gradcheck.py
python Compare_RNN/validation_tests/fairness_checks.py
python Compare_RNN/validation_tests/lyapunov_clip_tbptt_tests.py
python Compare_RNN/validation_tests/validate_all_methods.py
```

### 6.3 多 seed：报告 mean±std

示例（跑 3 个 seed）：
```bash
python tools/run_experiments.py --suite rnn --epochs 50 --scan-epochs 5 --batch-size 64 --hidden 128 --seed 1
python tools/run_experiments.py --suite rnn --epochs 50 --scan-epochs 5 --batch-size 64 --hidden 128 --seed 2
python tools/run_experiments.py --suite rnn --epochs 50 --scan-epochs 5 --batch-size 64 --hidden 128 --seed 3
python tools/aggregate_summaries.py --root plots/runner --out plots/runner/aggregate/summary_agg.csv
```

### 6.4 单任务脚本命令索引（逐任务更详细）

已将 `task/` 下每个任务入口脚本的“可复制终端指令”按目录拆分写入对应 README：

- RNN：`Compare_RNN/task/README.md`（以及 `Compare_RNN/task/*/README.md`）
- CNN：`Compare_CNN/task/README.md`（以及 `Compare_CNN/task/*/README.md`）

---

## 7. 方法细节（对齐论文/实现约定）

### 7.1 形状/接口契约（Shape & API Contract）

Compare_RNN 的统一约定：
- 输入 `inputs`：`(B, input_size, T)`
- 目标 `targets`：`(B, output_size, T)`（分类为 one-hot；回归为连续值）
- 隐状态 `h`：`(hidden, B)`
- `forward_cycle(inputs, h0)`：返回 `outputs_seq`（长度 `T`，每步 `(output_size, B)`）与 `h_last`
- `train_batch(inputs, targets, h0)`：返回 `(loss_scalar, h_last_detached)`

### 7.2 BPTT / TBPTT
- `TBPTT-k`：每 `k` 步做一次 backward+step，并在 chunk 边界 `h = h.detach()`。
- `time_normalization`：控制 loss 是否按时间长度归一化；梯度裁剪阈值会根据该选择做尺度对齐（见 validation tests）。

### 7.3 E-Prop / RFLO（rate-based）
- 公式对应：
  - `h_t = tanh(W_hh h_{t-1} + W_xh x_t + b_h)`
  - `y_hat_t = W_hy h_t + b_y`
  - `l_t = B * dL/dy_hat_t`（`feedback=symmetric` 时 `B=W_hy^T`）
  - eligibility traces：`e <- λ e + ψ * pre`，`ψ = (1 - h_t^2)`

### 7.4 Strict FPTT
- `build_chunk_schedule(T, parts)` 覆盖 `[0, T)`；支持极端 `T=0` 的安全返回。
- oracle buffer：每类每 chunk 仅用“第一个 misclassified”样本更新（可选 momentum 平滑）。
- regularizer：实现 alpha/beta/rho 的 proximal dynamics（对应 validation tests 里的公式对齐）。

---

## 8. Lyapunov 指数说明（稳定性诊断）

实现：`Compare_RNN/task/common/sequence_core.py:calculate_lyapunov_exponent_numpy`
- 算法：Benettin-style QR
- Jacobian：`J_t = diag(1 - h_t^2) @ W_hh`
- driver：默认从 **validation/train** 中选取范数“中位数”样本，避免使用 test 做调参/诊断。

一致性验证：`Compare_RNN/validation_tests/lyapunov_clip_tbptt_tests.py` 对齐 torch-QR 与 numpy-QR。

---

## 9. 输出文件与绘图

每次运行会在 `--plot-path` 指定目录下生成：
- `*_summary.csv`：每个方法一行（指标 + 训练计数 + runtime），并附带 `cfg_*`（配置）与 `env_*`（环境）列。
- `*_summary.json`：同内容的结构化版本，额外包含 `run_config` 与 `environment`（含 python/torch/cuda/git 版本信息）。
- `*_metric.png` / `*_curve.png` / `*_scan_*.png`：任务曲线与扫描结果图。

---

## 10. 常见问题（FAQ）

- Q: 运行 wikitext2_char 报 `ModuleNotFoundError: datasets`？
  - A: `pip install datasets`（或手动提供本地 `wiki.*.raw` 文件路径）。
- Q: DVS/SHD 任务缺少 tonic/aedat？
  - A: `pip install tonic aedat`；首次运行可能较慢（构建/缓存 frames）。
- Q: GPU 结果不完全一致？
  - A: 仓库默认启用 cudnn deterministic 设置，但某些算子在不同 GPU/驱动上仍可能有微小差异；建议报告多 seed mean±std。
