# Compare_RNN 中文说明

## 目标与范围
- Compare_RNN 用统一的 tanh RNN 比较 Local Rule、BPTT/TBPTT、E-Prop、Strict FPTT。
- 覆盖分类、回归、语言模型三类序列任务，并支持 Lyapunov 指标与增益扫描。
- 核心引擎在 `task/common/sequence_core.py`，算法细节在 `methods/`。

## 目录结构速览
- `methods/strict_fptt.py`：Strict FPTT 实现（分块、oracle buffer、FPTT 正则项）。
- `methods/standard_eprop.py`：E-Prop（RFLO 近似）实现，包含 eligibility traces。
- `methods/shared_rnn_utils.py`：统一初始化与参数拷贝，保证对照组起点一致。
- `task/common/sequence_core.py`：共享训练框架与数据/绘图工具。
- `task/classification/*.py`：分类任务脚本（MNIST、CIFAR10、DVS-CIFAR10）。
- `task/regression/*.py`：回归任务脚本（添加任务、Lorenz、视频等）。
- `task/lm/*.py`：语言模型任务（PTB 字符/词级）。
- `task/mnist.py` / `task/imdb.py` / `task/wikitext2.py` / `task/video.py` / `task/adding_problem.py`：自包含实验脚本（包含自实现训练逻辑）。
- `task/plotting_utils.py`：通用绘图风格与辅助函数。
- `analysis/oll_physical_probe/oll_physical_probe.py`：物理探针分析。
- `result/plot.py`：从结果文件绘制曲线。

## 数据表示与时间维
- 分类/回归统一格式：
  - 输入：`(N, input_size, time_steps)`
  - 目标：`(N, output_size, time_steps)`
  - 分类额外 `labels`：`(N,)`
- 分类目标通常通过 `build_repeated_targets` 将标签 one-hot 复制到每个时间步。
- 语言模型：
  - 原始数据是 1D token 流。
  - 按 `block_size` 切块后转成 one-hot 序列。

## 核心引擎：`task/common/sequence_core.py`

### 1) 通用工具
- `resolve_device` / `to_tensor`：统一设备与 dtype。
- `iterate_minibatches` / `split_train_val`：批次与验证集切分。
- `build_time_weights`：时间步权重策略（`none/final/late`）。
- `plot_*` / `save_results_summary`：指标、曲线与结果写盘。

### 2) 模型类
- `TorchLocalRuleRNN`：
  - 在线更新（无BPTT）。
  - `enable_fptt_surrogates` 启用 FPTT 软标签（`Q_t`）。
- `TorchBPTTRNN`（别名 `BPTTRNN`）：
  - 标准 BPTT，可选 `tbptt_steps` 截断。
  - `time_normalization` 控制损失归一化方式。
- `StandardEPropRNN`（来自 `methods/standard_eprop.py`）：
  - eligibility traces + 反馈矩阵学习信号。
- `StrictFPTTClassifier/StrictFPTTRegressor`（来自 `methods/strict_fptt.py`）：
  - 分块序列 + 正则项约束，适配分类与回归任务。

### 3) 训练/评估流程
- `train_batches` / `train_epoch_lm`：
  - 负责按 epoch 训练与 FPTT 软标签的按轮更新。
- `scan_gains_*`：
  - 扫描增益 `g`，比较验证集指标。
  - 可计算 Lyapunov 指标用于稳定性评估。
- `run_classification_task` / `run_regression_task` / `run_lm_task`：
  - “扫描→训练→评估→绘图”一体化流程。

## 算法实现：`methods/`
- `strict_fptt.py`
  - `build_chunk_schedule`：生成分块时间窗。
  - `ClassOracleBuffer` / `OracleBufferStore`：类条件 oracle 分布。
  - `FPTTRegularizer`：alpha/beta/rho 近端动力学正则项。
- `standard_eprop.py`
  - `TorchEPropRNN`：RFLO 近似，显式资格迹（eligibility traces）。
  - `feedback=random/symmetric` 控制反馈矩阵构造方式。
- `shared_rnn_utils.py`
  - `initialize_rnn_parameters` / `apply_rnn_parameters` / `extract_rnn_parameters`：
    统一初始化与参数共享，保证算法对照公平。
  - `EpochBatchScheduler`：固定随机批次顺序。

## 任务脚本说明

### 分类任务
- `task/classification/pixel_mnist.py`：MNIST 像素序列（784步）。
- `task/classification/row_mnist.py`：MNIST 行序列（28步）。
- `task/classification/permute_mnist.py`：MNIST 置换像素序列。
- `task/classification/seq_cifar10.py`：CIFAR-10 序列化版本。
- `task/classification/dvs_cifar10.py`：DVS-CIFAR10 序列。
- `task/classification/fptt_only_mnist.py`：仅 Strict FPTT 单模型。
- `task/classification/row_mnist_bptt_only.py`：仅 BPTT 对照。
- `task/classification/sequence_utils.py`：分类任务公共入口，重导出 `sequence_core`。

### 回归任务
- `task/regression/adding_task.py`：序列“添加任务”（累积两次标记值）。
- `task/regression/ready_set_go.py`：定时/节拍类任务。
- `task/regression/movie_prediction.py`：视频序列预测。
- `task/regression/movie_clip.py`：合成视频片段回放预测。
- `task/regression/lorenz_attractor.py`：Lorenz 动力系统序列。
- `task/regression/lorenz_attractor_localrule.py`：局部规则版本的 Lorenz 任务。
- `task/regression/lorenz_image.py`：将 Lorenz 轨迹映射到图像序列。
- `task/regression/sequence_utils.py`：回归任务公共入口。

### 语言模型任务
- `task/lm/ptb_char.py`：PTB 字符级语言模型。
- `task/lm/ptb_word.py`：PTB 词级语言模型。
- `task/lm/sequence_utils.py`：LM 数据与调用入口。

### 自包含实验脚本
这些脚本包含自己的训练/评估逻辑（不完全依赖 `sequence_core`）：
- `task/mnist.py`：MNIST 行序列（含 Lyapunov 计算与自定义训练循环）。
- `task/imdb.py`：IMDB 情感分类（自定义数据处理与训练循环）。
- `task/wikitext2.py`：Wikitext-2 相关实验。
- `task/video.py`：视频预测实验（含自定义训练流程）。
- `task/adding_problem.py`：经典 adding problem 的自实现版本。
- `task/test.py`：最小化测试脚本。

## 绘图与结果
- `task/plotting_utils.py`：统一风格与配色。
- `result/plot.py`：对外部结果文件做汇总绘图。
- 输出文件通常位于 `plots/`，并带有 `summary.json`/`summary.csv`。

## 默认运行方式（不加 `--`）
- 直接运行脚本即使用默认参数，例如：`python Compare_RNN/task/classification/row_mnist.py`。
- 每个脚本的默认值都写在 `argparse` 里，未传入 `--xxx` 时使用默认值。
- 常见默认行为（适用于大多数分类/回归/LM脚本）：
  - `--step-labels final`（不启用 FPTT 软标签）。
  - `--time-weighting none`（不对时间步加权）。
  - `--no-eprop` 未启用（默认包含 E-Prop 对照组，除非脚本不提供该开关）。
  - `--no-plot` 未启用（默认会画图并写入 `plots/`）。
- 训练轮数/隐藏维度/扫描轮数等具体默认值以各任务脚本为准。

## 常用参数（各任务通用）
- `--epochs` / `--scan-epochs`：训练轮数与扫描轮数。
- `--gains`：增益扫描列表（如 `0.6,0.9,1.2`）。
- `--step-labels {final,fptt}`：是否启用 FPTT 软标签。
- `--time-weighting {none,final,late}`：时间步权重策略。
- `--tbptt-short` / `--tbptt-long`：TBPTT 截断长度。
- `--no-eprop`：跳过 E-Prop 作为对照。
- `--no-plot`：关闭绘图与结果写盘。

## 运行示例
```bash
python Compare_RNN/task/classification/pixel_mnist.py --no-plot
python Compare_RNN/task/classification/row_mnist.py --step-labels fptt --no-plot
python Compare_RNN/task/regression/adding_task.py --no-plot
python Compare_RNN/task/lm/ptb_word.py --no-plot
```

## 任务脚本命令索引（逐任务更详细）

已将 `Compare_RNN/task` 下每个任务的“可复制终端指令”按目录拆分写入对应 README：

- `Compare_RNN/task/README.md`
- `Compare_RNN/task/classification/README.md`
- `Compare_RNN/task/regression/README.md`
- `Compare_RNN/task/lm/README.md`
