# 虚假遗忘识别与缓解机制实验代码

## 📋 目录

- [快速开始](#快速开始)
- [项目概述](#项目概述)
- [环境准备](#环境准备)
- [运行实验](#运行实验)
- [实验组说明](#实验组说明)
- [实验结果](#实验结果)
- [常见问题](#常见问题)
- [项目结构](#项目结构)

---

## 🚀 快速开始

### 3步快速运行

1. **安装依赖**：`pip install -r requirements.txt`
2. **安装Ollama**：访问 https://ollama.ai 下载安装，然后运行 `ollama serve`
3. **拉取模型**：`ollama pull qwen2.5:3b`（或使用完整4个模型）
4. **运行实验**：`python run_experiments.py`

### 检查环境

```bash
# 检查Ollama连接和模型
python run_experiments.py --check-ollama
```

---

## 项目概述

本实验代码库实现了虚假遗忘识别与缓解机制的核心实验，包括：

1. **虚假遗忘识别验证**：验证提出的虚假遗忘识别指标和分析工具的有效性
2. **深层对齐训练验证**：验证深层对齐训练（Deep Alignment Training）的有效性
3. **消融实验**：分析各个组件的贡献，验证方法设计的合理性

### 核心特性

- ✅ 使用Ollama部署的4个Qwen模型（1.7B, 3B, 4B, 32B）
- ✅ 实现深层对齐训练（Deep Alignment Training）
- ✅ 实现自适应缓解策略（Adaptive Mitigation）
- ✅ 统一的实验入口（`run_experiments.py`）

---

## 环境准备

### 前置要求

- Python 3.8+
- Ollama（用于运行Qwen模型）
- CUDA（可选，用于GPU加速）

### 1. 安装Python依赖

```bash
pip install -r requirements.txt
```

### 2. 安装和配置Ollama

#### Windows:
1. 访问 https://ollama.ai/download 下载并安装
2. 打开命令行，运行：
```bash
ollama serve
```

#### Linux/Mac:
```bash
curl -fsSL https://ollama.ai/install.sh | sh
ollama serve
```

### 3. 拉取模型

```bash
ollama pull qwen3:1.7b
ollama pull qwen2.5:3b
ollama pull qwen3:4b
ollama pull qwen2.5:32b
```

**注意**：32B模型较大（约18GB），如果资源有限可以先只拉取较小的模型。

### 4. 检查Ollama设置

```bash
python run_experiments.py --check-ollama
```

---

## 运行实验

### 基本运行

运行所有实验（使用所有4个模型和所有实验组）：

```bash
python run_experiments.py
```

### 指定参数

```bash
# 使用特定模型
python run_experiments.py --models qwen2.5:3b qwen3:4b

# 使用特定数据集
python run_experiments.py --datasets clinc150

# 运行特定实验组
python run_experiments.py --experiment-groups baseline_control ablation

# 使用CPU（如果没有GPU）
python run_experiments.py --device cpu

# 禁用深层对齐训练（用于对比实验）
python run_experiments.py --no-deep-alignment

# 禁用混合策略（用于对比实验）
python run_experiments.py --no-hybrid-strategy
```

### 组合使用

```bash
# 运行完整实验（深层对齐训练 + 混合策略）
python run_experiments.py \
    --use-deep-alignment \
    --use-hybrid-strategy \
    --datasets clinc150 20newsgroups \
    --models qwen2.5:3b qwen2.5:32b
```

---

## 实验组说明

### 实验组1：基线对照组（Baseline Control Group）

**实验目的**：
- 观察自然状态下的遗忘情况，建立基线
- 评估标准持续学习方法的性能下降情况

**运行命令**：
```bash
python run_experiments.py \
  --models qwen2.5:3b \
  --datasets clinc150 \
  --experiment-groups baseline_control
```

**关键参数**：
- 实验组名称：`baseline_control`
- 训练策略：标准训练，无缓解策略
- 无冻结层
- 无深层对齐训练

### 实验组2：虚假遗忘诱导组（Spurious Forgetting Induced Group）

**实验目的**：
- 通过冻结底层30%层，诱导虚假遗忘
- 验证虚假遗忘的特征：表示空间变化小，但性能下降大
- 验证可逆性分数应该较高（>0.6）

**运行命令**：
```bash
python run_experiments.py \
  --models qwen2.5:3b \
  --datasets clinc150 \
  --experiment-groups spurious_forgetting_induced
```

**关键参数**：
- 实验组名称：`spurious_forgetting_induced`
- 冻结策略：冻结底层30%层
- 预期结果：对齐度下降主要发生在顶层，可逆性分数高

### 实验组3：真实遗忘诱导组（True Forgetting Induced Group）

**实验目的**：
- 通过高强度训练新任务（10 epochs），最小化旧任务数据，诱导真实遗忘
- 验证真实遗忘的特征：表示空间变化大，性能下降大
- 验证可逆性分数应该较低（<0.6）

**运行命令**：
```bash
python run_experiments.py \
  --models qwen2.5:3b \
  --datasets clinc150 \
  --experiment-groups true_forgetting_induced
```

**关键参数**：
- 实验组名称：`true_forgetting_induced`
- 训练策略：高强度训练（10 epochs）
- 预期结果：表示空间发生根本性改变，可逆性分数低

### 实验组4：混合遗忘组（Mixed Forgetting Group）

**实验目的**：
- 部分任务诱导虚假遗忘，部分任务诱导真实遗忘
- 验证识别方法在复杂场景下的表现
- 验证能够区分不同类型的遗忘

**运行命令**：
```bash
python run_experiments.py \
  --models qwen2.5:3b \
  --datasets clinc150 \
  --experiment-groups mixed_forgetting
```

**关键参数**：
- 实验组名称：`mixed_forgetting`
- 训练策略：结合冻结和高强度训练
- 预期结果：识别准确率 > 85%，能够正确区分虚假遗忘和真实遗忘

### 实验组5：深层对齐训练验证（Deep Alignment Training）

**实验目的**：
- 验证深层对齐训练（Deep Alignment Training）的有效性
- 验证通过深层对齐训练可以缓解虚假遗忘

**运行命令**：
```bash
# 启用深层对齐训练（默认启用）
python run_experiments.py \
  --models qwen2.5:3b \
  --datasets clinc150 \
  --experiment-groups deep_alignment_training \
  --use-deep-alignment
```

**关键参数**：
- 实验组名称：`deep_alignment_training`
- 深层对齐阈值：τ_deep = 0.7
- 深层对齐深度：D > 10

### 实验组6：消融实验（Ablation Study）

**实验目的**：分析各个组件的贡献，验证方法设计的合理性

**运行命令**：
```bash
# 使用单个模型和单个数据集运行消融实验
python run_experiments.py \
  --models qwen2.5:3b \
  --datasets clinc150 \
  --experiment-groups ablation
```

**消融组件说明**：
1. **完整方法**：所有组件都使用
2. **无对齐度指标**：移除对齐度指标，仅使用可逆性
3. **无可逆性指标**：移除可逆性指标，仅使用对齐度
4. **无动态跟踪**：不跟踪表示空间，仅使用最终状态
5. **固定冻结策略**：使用固定30%冻结，不使用自适应
6. **仅对齐度指标**：只使用对齐度指标
7. **仅可逆性指标**：只使用可逆性指标

### 实验组列表

| 实验组名称 | 说明 |
|-----------|------|
| `baseline_control` | 基线对照组（标准训练） |
| `spurious_forgetting_induced` | 虚假遗忘诱导组（冻结底层30%） |
| `true_forgetting_induced` | 真实遗忘诱导组（高强度训练） |
| `mixed_forgetting` | 混合遗忘组 |
| `ablation` | 消融实验组 |
| `deep_alignment_training` | 深层对齐训练验证组 |

---

## 实验结果

### 结果文件位置

实验结果保存在 `./results/` 目录下，包括：

1. **单个实验结果**: `{model}_{dataset}_{group}_{timestamp}.json`
2. **总结报告**: `summary_{timestamp}.json`

### 结果格式

每个结果文件包含：

```json
{
  "model": "qwen2.5:3b",
  "dataset": "clinc150",
  "experiment_group": "baseline_control",
  "task_results": {
    "0": {
      "performance_before": 0.85,
      "performance_after": 0.82,
      "alignment_depth": 3,
      "reversibility_score": 0.75,
      "spurious_forgetting_score": 0.65,
      "forgetting_type": "spurious"
    }
  },
  "identification_accuracy": {
    "spurious": 0.89,
    "true": 0.87,
    "overall": 0.88
  },
  "metrics": {
    "average_accuracy": 0.764,
    "backward_transfer": -0.01
  }
}
```

### 预期结果

1. **识别准确率**：应该达到86.2%-90.6%
2. **对齐深度**：
   - 标准训练：D ≤ 3
   - 深层对齐训练：D > 12
3. **鲁棒性提升**：深层对齐训练应提升3.3%-7.1%

---

## 常见问题

### 1. Ollama连接失败

**问题**：无法连接到Ollama服务

**解决**：
```bash
# 确保Ollama服务正在运行
ollama serve

# 检查服务状态
curl http://localhost:11434/api/tags
```

### 2. 模型不存在

**问题**：模型未找到

**解决**：
```bash
# 拉取缺失的模型
ollama pull qwen3:1.7b
ollama pull qwen2.5:3b
ollama pull qwen3:4b
ollama pull qwen2.5:32b

# 查看已安装的模型
ollama list
```

### 3. 内存不足

**问题**：运行32B模型时内存不足

**解决**：
- 使用较小的模型：`--models qwen2.5:3b`
- 减少batch_size（在config.py中设置）
- 使用CPU模式：`--device cpu`（较慢）

### 4. CUDA不可用

**问题**：CUDA不可用

**常见原因和解决方案**：

1. **PyTorch安装的是CPU版本（最常见）**
   ```bash
   # 卸载CPU版本
   pip uninstall torch torchvision torchaudio
   
   # 安装CUDA版本（根据您的CUDA版本选择）
   # CUDA 11.8:
   pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118
   
   # CUDA 12.1:
   pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu121
   
   # 查看所有版本: https://pytorch.org/get-started/locally/
   ```

2. **NVIDIA驱动未安装**
   - 下载并安装NVIDIA驱动: https://www.nvidia.com/Download/index.aspx
   - 检查驱动: `nvidia-smi`

3. **没有NVIDIA GPU**
   - 使用CPU模式: `python run_experiments.py --device cpu`
   - 注意：CPU模式运行较慢，但可以正常工作

### 5. 实验运行时间过长

**问题**：完整实验需要很长时间

**解决**：
1. 仅运行部分模型：`--models qwen2.5:3b`
2. 仅运行部分数据集：`--datasets clinc150`
3. 减少任务数量（在config.py中设置 `num_tasks`）

---

## 项目结构

```
灾难遗忘/
├── README_CN.md                 # 项目说明（中文）
├── README_EN.md                 # 项目说明（英文）
├── requirements.txt            # 依赖包
├── config.py                   # 配置文件
├── main.py                     # 主程序入口（旧接口）
├── run_experiments.py          # 实验主入口 ⭐
├── setup_hf_mirror.py          # HuggingFace镜像设置工具
├── data/                       # 数据处理模块
│   ├── __init__.py
│   ├── datasets.py            # 数据集加载
│   └── clinc150_cache/        # CLINC-150数据集缓存
├── models/                     # 模型定义
│   ├── __init__.py
│   ├── base_model.py          # 基础模型类
│   └── qwen_model.py          # Qwen模型（本地和Ollama，实验使用）⭐
├── metrics/                    # 评测指标
│   ├── __init__.py
│   ├── alignment_score.py     # 对齐度指标
│   ├── reversibility.py       # 可逆性指标
│   ├── forgetting_metrics.py  # 遗忘指标
│   └── evaluation.py          # 综合评测
├── analysis/                   # 表示空间分析工具
│   ├── __init__.py
│   ├── alignment_analyzer.py  # 对齐分析工具
│   ├── reversibility_analyzer.py # 可逆性分析工具
│   ├── representation_tracker.py # 动态跟踪工具
│   ├── cka_implementation.py  # CKA（Centered Kernel Alignment）实现
│   └── visualization.py       # 可视化工具
├── experiments/                # 实验脚本
│   ├── __init__.py
│   ├── main_experiment.py     # 主实验脚本 ⭐
│   └── spurious_forgetting_identification.py  # 虚假遗忘识别实验
├── training/                   # 训练模块
│   ├── __init__.py
│   ├── deep_alignment_trainer.py # 深层对齐训练 ⭐
│   └── adaptive_mitigation.py  # 自适应缓解策略 ⭐
├── utils/                      # 工具函数
│   ├── __init__.py
│   ├── logger.py              # 日志工具
│   ├── helpers.py             # 辅助函数
│   └── ollama_helper.py       # Ollama辅助工具
├── results/                    # 实验结果目录（实验运行后自动生成）
├── logs/                       # 日志目录
└── examples/                   # 示例代码目录
```

---

## 数据集

本项目使用以下开源数据集：

1. **CLINC-150**: 自然语言理解数据集，15个意图分类任务
2. **20 Newsgroups**: 文本分类数据集，5个任务

---

## 支持的模型

本实验使用以下Qwen模型（通过Ollama部署）：

1. **Qwen3-1.7B** (`qwen3:1.7b`) - 1.7B参数
2. **Qwen2.5-3B** (`qwen2.5:3b`) - 3B参数
3. **Qwen3-4B** (`qwen3:4b`) - 4B参数
4. **Qwen2.5-32B** (`qwen2.5:32b`) - 32B参数 ⭐ **推荐**

**使用Ollama模型的优势**：
- 支持更大的模型（如32B）
- 无需本地下载完整模型
- 自动GPU加速（如果可用）
- 更灵活的模型管理

---

## 评测指标

- **识别准确率**: 虚假遗忘和真实遗忘的识别准确率
- **对齐度指标**: 任务对齐的量化度量
- **可逆性指标**: 遗忘可逆性的评分
- **平均准确率**: 所有任务的平均准确率
- **遗忘率**: 旧任务的性能下降率
- **前向/后向迁移**: 知识迁移效果

---

## 命令行参数

### 常用参数说明

| 参数 | 说明 | 默认值 | 示例 |
|------|------|--------|------|
| `--models` | 要使用的模型列表 | 所有4个模型 | `--models qwen2.5:3b` |
| `--datasets` | 要使用的数据集 | `clinc150 20newsgroups` | `--datasets clinc150` |
| `--experiment-groups` | 要运行的实验组 | 所有组 | `--experiment-groups baseline_control` |
| `--device` | 计算设备 | `cuda` | `--device cpu` |
| `--use-deep-alignment` | 启用深层对齐训练 | `True` | `--use-deep-alignment` |
| `--no-deep-alignment` | 禁用深层对齐训练 | - | `--no-deep-alignment` |
| `--use-hybrid-strategy` | 启用混合缓解策略 | `True` | `--use-hybrid-strategy` |
| `--no-hybrid-strategy` | 禁用混合缓解策略 | - | `--no-hybrid-strategy` |
| `--ollama-url` | Ollama服务地址 | `http://localhost:11434` | `--ollama-url http://localhost:11434` |
| `--check-ollama` | 仅检查Ollama设置 | - | `--check-ollama` |

### 查看帮助

```bash
python run_experiments.py --help
```

---

## 推荐运行流程

### 首次运行

```bash
# 1. 检查环境
python run_experiments.py --check-ollama

# 2. 运行小规模测试（使用小模型）
python run_experiments.py --models qwen2.5:3b --datasets clinc150

# 3. 如果测试成功，运行完整实验
python run_experiments.py
```

### 日常运行

```bash
# 直接运行实验
python run_experiments.py
```

### 提示

- 首次运行建议先使用小模型（如 `qwen2.5:3b`）测试
- 完整实验可能需要较长时间，建议在后台运行
- 结果会自动保存，可以随时中断和恢复
- 如果遇到问题，先运行 `--check-ollama` 检查环境

