# Ablation实验一致性分析报告

## 概述

使用Qwen3-8B一致性情况：
1. 8B（完整模型）
2. onlynews（仅使用新闻文本的消融模型）
3. onlyts（仅使用时间序列的消融模型）

我们统计了以下几种情况的占比：
1. 两个模型都预测正确
2. 仅第一个模型预测正确
3. 仅第二个模型预测正确
4. 两个模型都预测错误

## 主要发现

### 1. Trendstrength数据集（趋势+强度）

在test数据集中：
- 8B vs onlynews一致性：
  - 都正确: 1.11%
  - 仅8B正确: 7.07%
  - 仅onlynews正确: 9.19%
  - 都错误: 82.63%

- 8B vs onlyts一致性：
  - 都正确: 3.05%
  - 仅8B正确: 5.13%
  - 仅onlyts正确: 6.24%
  - 都错误: 85.58%

**分析**：在趋势和强度预测任务中，onlynews模型表现略优于onlyts模型，但整体准确率都很低。

### 2. Trendonly数据集（仅趋势）

在test数据集中：
- 8B vs onlynews一致性：
  - 都正确: 20.38%
  - 仅8B正确: 19.77%
  - 仅onlynews正确: 30.68%
  - 都错误: 29.16%

- 8B vs onlyts一致性：
  - 都正确: 34.32%
  - 仅8B正确: 5.83%
  - 仅onlyts正确: 13.68%
  - 都错误: 46.16%

**分析**：在仅趋势预测任务中，onlyts模型表现明显优于onlynews模型，且与8B模型的一致性最高。

### 3. Globalonly数据集（仅全局趋势）

在test数据集中：
- 8B vs onlynews一致性：
  - 都正确: 39.89%
  - 仅8B正确: 28.53%
  - 仅onlynews正确: 18.44%
  - 都错误: 13.15%

- 8B vs onlyts一致性：
  - 都正确: 58.01%
  - 仅8B正确: 10.40%
  - 仅onlyts正确: 12.57%
  - 都错误: 19.02%

**分析**：在全局趋势预测任务中，onlyts模型表现最好，与8B模型的一致性最高。

## 结论

1. **在复杂任务中（trendstrength），完整模型表现最好**：在需要同时预测趋势和强度的任务中，完整8B模型与两个消融模型的一致性都不高，但仍然优于单独的消融模型。

2. **在趋势预测任务中（trendonly），onlyts模型表现最佳**：在仅需预测趋势的任务中，onlyts模型与8B模型的一致性最高，达到了34.32%。

3. **在全局趋势预测任务中（globalonly），onlyts模型表现最好**：在全局趋势预测任务中，onlyts模型与8B模型的一致性最高，达到了58.01%。

4. **时间序列信息在预测中起关键作用**：整体来看，onlyts模型在大多数任务中都优于onlynews模型，表明时间序列信息在股价预测任务中起着关键作用。

5. **多模态融合的优势**：虽然消融模型在某些特定任务上有不错的表现，但完整8B模型在整体上仍然保持了与各消融模型的良好一致性，体现了多模态融合的价值。

这些结果表明，在金融时间序列预测任务中，时间序列信息比新闻文本信息更为重要，但将两者结合的完整模型仍然能够提供额外的价值。