8B和8B_Ablation系列模型详细一致性分析
================================================================================

数据集类型: trendstrength
--------------------------------------------------
  test 数据集:
    Step级别统计:
      都正确:    87/ 7835 (  1.11%)
      仅8B正确:   554/ 7835 (  7.07%)
      仅Ablation正确:   720/ 7835 (  9.19%)
      都错误:  6474/ 7835 ( 82.63%)
    强度级别统计:
      都正确:   291/ 7835 (  3.71%)
      仅8B正确:   951/ 7835 ( 12.14%)
      仅Ablation正确:  1088/ 7835 ( 13.89%)
      都错误:  5505/ 7835 ( 70.26%)
  vali 数据集:
    Step级别统计:
      都正确:    81/ 7120 (  1.14%)
      仅8B正确:   460/ 7120 (  6.46%)
      仅Ablation正确:   691/ 7120 (  9.71%)
      都错误:  5888/ 7120 ( 82.70%)
    强度级别统计:
      都正确:   286/ 7120 (  4.02%)
      仅8B正确:   849/ 7120 ( 11.92%)
      仅Ablation正确:  1033/ 7120 ( 14.51%)
      都错误:  4952/ 7120 ( 69.55%)
  train 数据集:
    Step级别统计:
      都正确:   339/34210 (  0.99%)
      仅8B正确:  2371/34210 (  6.93%)
      仅Ablation正确:  3002/34210 (  8.78%)
      都错误: 28498/34210 ( 83.30%)
    强度级别统计:
      都正确:  1209/34210 (  3.53%)
      仅8B正确:  4292/34210 ( 12.55%)
      仅Ablation正确:  4718/34210 ( 13.79%)
      都错误: 23991/34210 ( 70.13%)

数据集类型: trendonly
--------------------------------------------------
  test 数据集:
    Step级别统计:
      都正确:  1597/ 7835 ( 20.38%)
      仅8B正确:  1549/ 7835 ( 19.77%)
      仅Ablation正确:  2404/ 7835 ( 30.68%)
      都错误:  2285/ 7835 ( 29.16%)
  vali 数据集:
    Step级别统计:
      都正确:  1481/ 7120 ( 20.80%)
      仅8B正确:  1393/ 7120 ( 19.56%)
      仅Ablation正确:  2144/ 7120 ( 30.11%)
      都错误:  2102/ 7120 ( 29.52%)
  train 数据集:
    Step级别统计:
      都正确:  6849/34210 ( 20.02%)
      仅8B正确:  7061/34210 ( 20.64%)
      仅Ablation正确:  9988/34210 ( 29.20%)
      都错误: 10312/34210 ( 30.14%)

数据集类型: globalonly
--------------------------------------------------
  test 数据集:
    Record级别统计:
      都正确:   625/ 1567 ( 39.89%)
      仅8B正确:   447/ 1567 ( 28.53%)
      仅Ablation正确:   289/ 1567 ( 18.44%)
      都错误:   206/ 1567 ( 13.15%)
  vali 数据集:
    Record级别统计:
      都正确:   545/ 1424 ( 38.27%)
      仅8B正确:   400/ 1424 ( 28.09%)
      仅Ablation正确:   278/ 1424 ( 19.52%)
      都错误:   201/ 1424 ( 14.12%)
  train 数据集:
    Record级别统计:
      都正确:  2707/ 6842 ( 39.56%)
      仅8B正确:  1869/ 6842 ( 27.32%)
      仅Ablation正确:  1296/ 6842 ( 18.94%)
      都错误:   970/ 6842 ( 14.18%)
