# OLL 物理探针（Row-by-Row MNIST / Lorenz 图像预测 / Adding Problem）

这个实验会在训练过程中“剖开”Online Local Learning (OLL) 的 RNN，把内部张量（状态、教学信号、λ 等）记录下来，并用一个 **同权重的 autograd RNN** 计算 **BPTT 真梯度**，从而对核心物理假设做定量检验。

## 实验包含哪些任务
- 任务 A：`row_mnist`，MNIST 行序列（序列长 28，输入维度 28，分类）。
- 任务 B：`lorenz_image`，Lorenz 图像预测（默认 16×16，序列长 30，回归，可 teacher/rollout 评估）。
- 任务 C：`adding_problem` / `addtask`，Adding Problem 的 seq2seq 版本（输入 2 通道：value+marker，目标是“标记值的运行累加和”，回归）。
- 任务 D：`convex_quadratic`，一个 2D 的小型凸二次优化任务，用来直观看到 **简化版** `local_rule`（对角预条件 GD） vs `BPTT`（普通 GD）的下降路径与 loss 曲线。
- 任务 E：`rnn_descent`，用一个小型 RNN（Adding Problem，固定 batch）可视化 **OLL(local_rule) vs BPTT** 的下降轨迹（2D 参数投影 + loss）与 loss 曲线。

## 模型与训练/探针
- 模型：tanh 激活的 vanilla RNN。
- 训练：本地规则更新（`TorchLocalRuleRNN`）。
- 探针：用辅助 autograd RNN 计算 BPTT 梯度，并与 OLL 教学信号做对齐检验。

## 如何运行（PowerShell/Windows）
PowerShell 的换行符用反引号 `` ` ``，不是 `\`。

### 1) Row-by-Row MNIST（分类）
```powershell
Set-Location D:\PKU
python .\Compare_RNN\analysis\oll_physical_probe\oll_physical_probe.py `
  --task row_mnist `
  --epochs 50 `
  --scan-epochs 5 `
  --batch-size 64 `
  --hidden 128 `
  --lr 1e-3 `
  --seed 42 `
  --train-limit 60000 `
  --test-limit 10000 `
  --gain-select val `
  --gains "0.2,0.3667,0.5333,0.7000,0.8667,1.0333,1.2000,1.3667,1.5333,1.7000,1.8667,2.0333"
```

固定 gain 复现（mnist 在 gain=0.533 运行）：
```powershell
Set-Location D:\PKU
python .\Compare_RNN\analysis\oll_physical_probe\oll_physical_probe.py `
  --task row_mnist `
  --epochs 50 `
  --scan-epochs 5 `
  --batch-size 64 `
  --hidden 128 `
  --lr 1e-3 `
  --seed 42 `
  --train-limit 60000 `
  --test-limit 10000 `
  --gain 0.533
```

### 2) Lorenz 图像预测（回归）
```powershell
Set-Location D:\PKU
python .\Compare_RNN\analysis\oll_physical_probe\oll_physical_probe.py `
  --task lorenz_image `
  --epochs 30 `
  --scan-epochs 5 `
  --batch-size 64 `
  --hidden 192 `
  --lr 1e-3 `
  --seed 42 `
  --train-samples 10000 `
  --test-samples 1000 `
  --seq-len 30 `
  --frame-h 16 `
  --frame-w 16 `
  --dt 0.01 `
  --sigma 10.0 `
  --rho 28.0 `
  --beta 2.6667 `
  --warmup 100 `
  --blur-sigma 1.2 `
  --eval-mode rollout `
  --eval-warmup 1 `
  --gain-select val `
  --gains "0.05,0.20,0.35,0.50,0.65,0.80,0.95,1.10,1.25,1.40,1.55,1.70"
```

固定 gain 复现（洛伦兹在 gain=1.250 运行）：
```powershell
Set-Location D:\PKU
python .\Compare_RNN\analysis\oll_physical_probe\oll_physical_probe.py `
  --task lorenz_image `
  --epochs 30 `
  --scan-epochs 5 `
  --batch-size 64 `
  --hidden 192 `
  --lr 1e-3 `
  --seed 42 `
  --train-samples 10000 `
  --test-samples 1000 `
  --seq-len 30 `
  --frame-h 16 `
  --frame-w 16 `
  --dt 0.01 `
  --sigma 10.0 `
  --rho 28.0 `
  --beta 2.6667 `
  --warmup 100 `
  --blur-sigma 1.2 `
  --eval-mode rollout `
  --eval-warmup 1 `
  --gain 1.250
```

Lorenz 会在报告中额外给出 **Lyapunov≈-1 的诊断**（包括 `lyapunov_log_growth_*` 两张图），用于解释训练后为何呈现“强收缩”。

### 3) Adding Problem / addtask（回归）
```powershell
Set-Location D:\PKU
python .\Compare_RNN\analysis\oll_physical_probe\oll_physical_probe.py `
  --task addtask `
  --epochs 30 `
  --scan-epochs 5 `
  --batch-size 64 `
  --hidden 128 `
  --lr 1e-3 `
  --seed 42 `
  --train-samples 20000 `
  --test-samples 2000 `
  --add-seq-len 64 `
  --gain-select val
```
Adding Problem 的输入是固定给定的，因此评估模式强制为 `teacher`（即使传了 `--eval-mode rollout` 也会自动回退）。

固定 gain 复现（add 在 gain=1.050 运行）：
```powershell
Set-Location D:\PKU
python .\Compare_RNN\analysis\oll_physical_probe\oll_physical_probe.py `
  --task addtask `
  --epochs 30 `
  --scan-epochs 5 `
  --batch-size 64 `
  --hidden 128 `
  --lr 1e-3 `
  --seed 42 `
  --train-samples 20000 `
  --test-samples 2000 `
  --add-seq-len 64 `
  --gain 1.050
```

### 4) Toy 凸优化：convex_quadratic（三维下降曲线）
这个任务不做物理探针分析，输出：
- loss 等高线 + 两条下降路径（更直观）
- loss 曲线（loss vs step）
- 3D 轨迹图（w1, w2, loss）

注意：这里的 `local_rule` 只是“对角预条件 GD”的 toy 版本，用来直观展示**预条件**效果；要看完整未简化的 OLL `local_rule` 更新，请用下面的 `rnn_descent`。

```powershell
Set-Location D:\PKU
python .\Compare_RNN\analysis\oll_physical_probe\oll_physical_probe.py `
  --task convex_quadratic `
  --seed 42 `
  --convex-steps 120 `
  --convex-lr 0.18 `
  --convex-a11 8.0 `
  --convex-a12 3.0 `
  --convex-a22 2.0 `
  --convex-start -2.5 2.0 `
  --convex-target 1.0 -1.0
```

### 5) RNN 下降可视化：rnn_descent（OLL vs BPTT）
这个任务不做物理探针分析，固定一个 Adding Problem 的 batch，训练一个小型 RNN，输出：
- 2D 轨迹：在一个 2D 平面上画两条参数路径（对比 OLL(local_rule) vs BPTT）
- 3D 轨迹：2D 平面坐标 + loss
- loss 曲线：loss vs step

默认使用 `--descent-proj-mode pca`（用 PCA 找到更“好看/稳定”的 2D 平面）；你也可以用 `endpoints` 或 `random`。

```powershell
Set-Location D:\PKU
python .\Compare_RNN\analysis\oll_physical_probe\oll_physical_probe.py `
  --task rnn_descent `
  --seed 42 `
  --hidden 64 `
  --lr 1e-3 `
  --batch-size 64 `
  --add-seq-len 64 `
  --descent-steps 120 `
  --descent-proj-mode pca
```

## 输出位置
- 图像输出：`plots/oll_physical_probe_<task>/<timestamp>/`
- 报告输出：`Compare_RNN/result/oll_physical_probe_<task>_report.md`

## 关键参数说明
- `--task`: `row_mnist` / `lorenz_image` / `adding_problem` / `addtask` / `convex_quadratic` / `rnn_descent`。
- `--gain-select`: `val` 或 `critical`（默认 `val`）。`critical` 会优先匹配临界指标，可能牺牲任务性能。
- `--critical-metric`: `rho_eff` / `eff_gain_p95` / `lyap_pre` / `lyap_post`。
- `--gains` / `--gain`: 扫描多个 gain 或固定单个 gain。
- `convex_quadratic` 专用：`--convex-steps`、`--convex-lr`、`--convex-a11`、`--convex-a12`、`--convex-a22`、`--convex-start`、`--convex-target`。
- `rnn_descent` 专用：`--descent-steps`、`--descent-proj-mode`、`--descent-proj-seed`（`random` 时控制 2D 参数投影方向）。
- `--probe-points`: 训练过程中采样 probe snapshot 的次数。
- `--probe-time-points`: rank-1 分析的采样点数。
- `--neighbor-k`: 局部邻域大小 K。
- `--analysis-select`: 选择用于“分析统计/假设检验”的 snapshot：`rho_target` / `final` / `step`（默认 `rho_target`）。
- `--analysis-rho-target`: 当 `--analysis-select=rho_target` 时，按 `rho_max` 接近该目标挑选（默认 1.0）。
- `--analysis-step`: 当 `--analysis-select=step` 时，指定 probe step（会取最近的可用 step）。
- `--heatmap-select`: 选择用于“梯度散点/热力图”的 snapshot：`analysis` / `rho_target` / `final` / `step`（默认 `analysis`）。
- `--heatmap-rho-target` / `--heatmap-step`: 分别对应 `rho_target` / `step` 的挑选方式。
- `--report-path`: 指定报告输出路径。
- Lorenz 专用：`--seq-len`、`--frame-h`、`--frame-w`、`--dt`、`--sigma`、`--rho`、`--beta`、`--warmup`、`--blur-sigma`、`--eval-mode`、`--eval-warmup`。
- Adding 专用：`--add-seq-len`。

## 备注
- rank-1/动态低秩分析会跨 batch×time 采样，因为某些任务序列较短（如 MNIST 仅 28 步）。
- probe batch 固定（同一批样本）以提升不同训练 step 的可比性。
- `rho_target≈1` 更偏“临界性附近”的分析选择策略，不一定最适合画热力图；需要时用 `--heatmap-select final` 或 `--heatmap-select step` 单独指定取点。
- PC1 稳定性：对每个中心的局部 `s` 矩阵做 split-half，比较两半的**空间主方向**（SVD 的 `U[:,0]`）夹角余弦（绝对值）。
- Eigen-residual check：用末端 10 步的 `s` 构造局部 source-term 矩阵，计算 `q_s` 是否近似特征方向（`‖A_local q_s-μ q_s‖/‖A_local q_s‖`），并额外报告：
  - `Align(q_s, eig_dom(A_local))` / `Align(q_s, svd_dom(A_local))`（是否与主导特征/奇异方向对齐）
  - `σ_min(I-A_local)` 与 `‖(I-A_local)^{-1} r‖ / ‖q_s‖`（resolvent 放大残差的强度，直接对应“谱选择性/残差项可忽略”的可检验条件）
- 动态谱对齐曲线：在多个 probe step 上重复计算上述对齐/残差，并同时给出“动态邻域”（每个 step 重新选 top-k）与“固定邻域”（固定在 step0 的 top-k）两种曲线，用于检验训练是否驱动对齐增强。
