# Compare_RNN/task/lm：语言模型任务运行命令

以下命令均从仓库根目录运行：`python Compare_RNN/task/lm/<script>.py ...`

## 通用参数

- `--epochs/--scan-epochs/--seed`：训练轮数/扫描轮数/随机种子
- `--ptb-block-size`：BPTT block 长度（序列切块）
- `--ptb-steps-per-epoch`：每个 epoch 训练 step 数（控制 compute budget）
- `--ptb-val-steps`：每次验证的 step 数
- `--step-labels {final,fptt}`：是否使用 FPTT surrogate 软标签
- `--no-eprop`：跳过 E-Prop
- `--no-plot`：关闭绘图与写盘
- `--plot-path`：指定输出目录

## PTB Char LM：`ptb_char.py`

`--ptb-path` 可指向本地 PTB 文本目录；不提供则由 `sequence_utils.try_load_ptb_text()` 尝试下载/读取（具体逻辑见代码）。

- 快速 smoke（限制字符数 + 少 steps）
  - `python Compare_RNN/task/lm/ptb_char.py --epochs 1 --scan-epochs 1 --ptb-max-chars 20000 --ptb-steps-per-epoch 20 --ptb-val-steps 10 --eval-every 1 --no-plot`
- 正常跑
  - `python Compare_RNN/task/lm/ptb_char.py --epochs 50 --scan-epochs 5 --batch-size 64 --hidden 128 --seed 42 --ptb-block-size 80 --ptb-steps-per-epoch 300 --ptb-val-steps 60 --plot-path plots/rnn_ptb_char`

## PTB Word LM：`ptb_word.py`

该脚本支持 `--dummy` 生成可复现的“伪文本”用于调试（无需准备 PTB 数据）。

- 快速 smoke（dummy 数据，无需 PTB）
  - `python Compare_RNN/task/lm/ptb_word.py --dummy --epochs 1 --scan-epochs 1 --dummy-tokens 20000 --dummy-vocab 200 --ptb-steps-per-epoch 20 --ptb-val-steps 10 --eval-every 1 --no-plot`
- 正常跑（真实 PTB）
  - `python Compare_RNN/task/lm/ptb_word.py --epochs 50 --scan-epochs 5 --batch-size 64 --hidden 128 --seed 42 --ptb-block-size 35 --ptb-steps-per-epoch 300 --ptb-val-steps 60 --plot-path plots/rnn_ptb_word`

## WikiText-2 Char LM：`wikitext2_char.py`

`--wikitext-path` 指向包含 `wiki.train.raw/wiki.valid.raw/wiki.test.raw` 的目录；若找不到，会尝试用 HuggingFace `datasets` 下载并缓存（需要 `pip install datasets`）。

- 快速 smoke（限制字符数 + 少 steps）
  - `python Compare_RNN/task/lm/wikitext2_char.py --epochs 1 --scan-epochs 1 --ptb-max-chars 20000 --ptb-steps-per-epoch 20 --ptb-val-steps 10 --eval-every 1 --no-plot`
- 正常跑
  - `python Compare_RNN/task/lm/wikitext2_char.py --epochs 50 --scan-epochs 5 --batch-size 64 --hidden 128 --seed 42 --ptb-block-size 80 --ptb-steps-per-epoch 200 --ptb-val-steps 60 --plot-path plots/rnn_wikitext2_char`

