# 时间序列形状分类标准说明

本文档详细说明了对48个时间步的ground_truth数据进行形状分类的标准。分类算法将时间序列分为5种类型：Rise（上升）、Fall（下降）、Peak（先增后减）、Recover（先减后增）、Oscillate（振荡）。

## 分类流程概述

分类采用**优先级顺序**进行：
1. **Oscillate（振荡）** - 最高优先级
2. **Rise/Fall（单调趋势）** - 在Peak/Recover之前检查
3. **Peak/Recover（单拐点模式）** - 放宽标准以适应48时间步数据
4. **默认Oscillate** - 如果以上都不满足

---

## 1. Oscillate（振荡）分类标准

**定义**：序列有多次方向变化，呈现振荡模式。

### 检测条件：
- **主要条件**：显著符号变化次数 ≥ 5次
  - 符号变化：一阶导数（相邻值差）的符号发生改变
  - 显著变化：变化幅度需超过最大变化幅度的15%
  
- **次要条件**：如果有≥4次符号变化，且变化间隔相对均匀
  - 间隔变异系数（标准差/均值）< 0.4
  - 表示振荡模式较为规律

### 特点：
- 优先级最高，如果检测到振荡，直接返回Oscillate
- 允许Peak/Recover模式有少量波动，但不会误判为振荡

---

## 2. Rise（上升）分类标准

**定义**：序列整体呈上升趋势，允许有少量波动。

### 检测条件（按优先级）：

#### 条件1：早期检测（在Peak检测之前）
- `positive_ratio >= 0.45` 且 `overall_slope > 0`
  - `positive_ratio`：一阶导数为正的比例（上升步数/总步数）
  - `overall_slope`：整体斜率 = (最后值 - 初始值) / 序列长度
- 同时满足：`best_peak_score < threshold * 2.0`
  - 确保Peak模式不够强，才分类为Rise

#### 条件2：Peak/Recover检测后
- `positive_ratio >= 0.42` 且 `overall_slope > 0`
- 如果Peak/Recover未被检测到，则检查此条件

#### 条件3：Fallback分支
- `positive_ratio >= 0.40` 且 `overall_slope > 0`
- 在trend_type为"Rise"时，如果Peak模式不强（`best_peak_score < threshold * 1.2`）

### 阈值说明：
- **0.45**：45%的步数为上升（早期检测，更严格）
- **0.42**：42%的步数为上升（主要检测标准）
- **0.40**：40%的步数为上升（Fallback，最宽松）

---

## 3. Fall（下降）分类标准

**定义**：序列整体呈下降趋势，允许有少量波动。

### 检测条件（按优先级）：

#### 条件1：早期检测（在Recover检测之前）
- `negative_ratio >= 0.45` 且 `overall_slope < 0`
  - `negative_ratio`：一阶导数为负的比例（下降步数/总步数）
- 同时满足：`best_recover_score < threshold * 2.0`
  - 确保Recover模式不够强，才分类为Fall

#### 条件2：Peak/Recover检测后
- `negative_ratio >= 0.42` 且 `overall_slope < 0`
- 如果Peak/Recover未被检测到，则检查此条件

#### 条件3：Fallback分支
- `negative_ratio >= 0.40` 且 `overall_slope < 0`
- 在trend_type为"Fall"时，如果Recover模式不强（`best_recover_score < threshold * 1.2`）

### 阈值说明：
- **0.45**：45%的步数为下降（早期检测，更严格）
- **0.42**：42%的步数为下降（主要检测标准）
- **0.40**：40%的步数为下降（Fallback，最宽松）

---

## 4. Peak（先增后减）分类标准

**定义**：序列先上升后下降，有一个明显的峰值点。

### 检测方法（多分割点策略）：

#### 步骤1：多分割点扫描
- 在序列的1/4到3/4位置之间，每隔约1/12长度检查一个分割点
- 对每个分割点计算：
  - 前半段斜率：`(分割点值 - 起始值) / 分割点位置`
  - 后半段斜率：`(结束值 - 分割点值) / (总长度 - 分割点位置)`
  - 归一化：除以序列的值域（最大值-最小值）

#### 步骤2：Peak评分
- 如果前半段斜率 > 0 且后半段斜率 < 0：
  - `peak_score = |前半段斜率| + |后半段斜率|`
  - 选择得分最高的分割点作为最佳Peak模式

#### 步骤3：验证条件
- `best_peak_score > threshold`（threshold = 0.002）或 `trend_type == "Peak"`
- 验证：`first_norm > threshold * 0.2` 且 `second_norm < -threshold * 0.2`
  - `first_norm`：前半段归一化斜率
  - `second_norm`：后半段归一化斜率
- 排除振荡：如果符号变化次数 ≥ 7，则优先分类为Oscillate

#### 辅助检测：最大值位置
- 如果最大值位置在序列前2/3，且最小值在其后：
  - 前半段斜率 > 0.003（归一化）
  - 后半段斜率 < -0.003（归一化）
  - 则标记为Peak模式

### 放宽标准说明：
- 对于48时间步数据，**不要求只有一个严格拐点**
- 允许有局部波动，只要整体呈现"先增后减"模式
- 使用多个分割点寻找最佳匹配，而不是固定中点

---

## 5. Recover（先减后增）分类标准

**定义**：序列先下降后上升，有一个明显的谷值点。

### 检测方法（多分割点策略）：

#### 步骤1：多分割点扫描
- 在序列的1/4到3/4位置之间，每隔约1/12长度检查一个分割点
- 对每个分割点计算：
  - 前半段斜率：`(分割点值 - 起始值) / 分割点位置`
  - 后半段斜率：`(结束值 - 分割点值) / (总长度 - 分割点位置)`
  - 归一化：除以序列的值域（最大值-最小值）

#### 步骤2：Recover评分
- 如果前半段斜率 < 0 且后半段斜率 > 0：
  - `recover_score = |前半段斜率| + |后半段斜率|`
  - 选择得分最高的分割点作为最佳Recover模式

#### 步骤3：验证条件
- `best_recover_score > threshold`（threshold = 0.002）或 `trend_type == "Recover"`
- 验证：`first_norm < -threshold * 0.2` 且 `second_norm > threshold * 0.2`
  - `first_norm`：前半段归一化斜率
  - `second_norm`：后半段归一化斜率
- 排除振荡：如果符号变化次数 ≥ 7，则优先分类为Oscillate

#### 辅助检测：最小值位置
- 如果最小值位置在序列前2/3，且最大值在其后：
  - 前半段斜率 < -0.003（归一化）
  - 后半段斜率 > 0.003（归一化）
  - 则标记为Recover模式

### 放宽标准说明：
- 对于48时间步数据，**不要求只有一个严格拐点**
- 允许有局部波动，只要整体呈现"先减后增"模式
- 使用多个分割点寻找最佳匹配，而不是固定中点

---

## 关键参数总结

### 阈值参数：
- **threshold = 0.002**：Peak/Recover检测的基础阈值
- **positive_ratio阈值**：0.45（早期）→ 0.42（主要）→ 0.40（Fallback）
- **negative_ratio阈值**：0.45（早期）→ 0.42（主要）→ 0.40（Fallback）
- **振荡检测**：≥5次显著符号变化，或≥4次且间隔均匀

### 归一化方法：
- 所有斜率计算都除以序列的值域（最大值-最小值）
- 使得不同尺度的数据可以统一比较

### 优先级规则：
1. **Oscillate** > **Rise/Fall** > **Peak/Recover** > **默认Oscillate**
2. Rise/Fall在Peak/Recover之前检查，但如果Peak/Recover模式很强，会优先分类为Peak/Recover
3. 如果都不满足，默认分类为Oscillate

---

## 设计理念

### 为什么放宽Peak/Recover标准？
- **48时间步数据特点**：时间步数较多，单一严格拐点过于严格
- **实际需求**：需要识别"整体先增后减"或"整体先减后增"的模式
- **多分割点策略**：通过扫描多个分割点，找到最能代表整体趋势的分割方式

### 为什么Rise/Fall比例较低？
- **数据特性**：48时间步的电力数据中，纯单调上升/下降的序列较少
- **波动性**：大多数序列都有一定波动，容易被分类为Peak/Recover或Oscillate
- **阈值设置**：已降低至42-45%，但比例仍较低，说明数据本身特性如此

---

## 使用建议

1. **调整阈值**：如需提高Rise/Fall比例，可继续降低positive_ratio/negative_ratio阈值（如降至0.38-0.40）
2. **调整优先级**：如需提高Peak/Recover比例，可降低best_peak_score/best_recover_score的竞争阈值
3. **调整振荡检测**：如需减少Oscillate比例，可提高min_oscillations（如从5提高到6或7）

