# 8B和8B_Ablation系列模型一致性分析报告

## 概述

本报告分析了8B和8B_Ablation系列模型在ver_synchronized系列数据集上的一致性情况，统计了以下几种情况的占比：
1. 8B对了Ablation没对
2. Ablation对了8B没对
3. 两者都对
4. 两者都错

## 主要发现

### 1. Trendstrength数据集（趋势+强度）

在test数据集中：
- Step级别：
  - 都正确: 1.11%
  - 仅8B正确: 7.07%
  - 仅Ablation正确: 9.19%
  - 都错误: 82.63%
- 强度级别：
  - 都正确: 3.71%
  - 仅8B正确: 12.14%
  - 仅Ablation正确: 13.89%
  - 都错误: 70.26%

**分析**：Ablation模型在趋势和强度预测上都略优于8B模型，但整体准确率仍然很低。

### 2. Trendonly数据集（仅趋势）

在test数据集中：
- Step级别：
  - 都正确: 20.38%
  - 仅8B正确: 19.77%
  - 仅Ablation正确: 30.68%
  - 都错误: 29.16%

**分析**：Ablation模型在趋势预测上明显优于8B模型，两者都对的比例也较高。

### 3. Globalonly数据集（仅全局趋势）

在test数据集中：
- Record级别：
  - 都正确: 39.89%
  - 仅8B正确: 28.53%
  - 仅Ablation正确: 18.44%
  - 都错误: 13.15%

**分析**：在全局趋势预测上，8B模型表现优于Ablation模型，两者都对的比例最高。

## 结论

1. **Trendonly数据集表现最好**：在所有数据集中，仅趋势预测任务的准确率最高，Ablation模型在该任务上表现优于8B模型。

2. **Trendstrength任务最具挑战性**：包含趋势和强度的联合预测任务准确率最低，即使两个模型都难以准确预测。

3. **Ablation模型在细粒度预测上表现更好**：在trendonly和trendstrength任务中，Ablation模型的表现优于8B模型。

4. **8B模型在全局预测上表现更好**：在仅预测全局趋势的任务中，8B模型的表现优于Ablation模型。

这些结果表明，不同的模型变体在不同类型的预测任务上具有不同的优势，Ablation模型在细粒度的步进预测上表现更好，而8B模型在全局趋势预测上更准确。