8B和8B_Ablation系列模型详细一致性分析
================================================================================

数据集类型: trendstrength
--------------------------------------------------
  test 数据集:
    Step级别统计:
      都正确:    87/ 7835 (  1.11%)
      仅8B正确:   554/ 7835 (  7.07%)
      仅Ablation正确:   720/ 7835 (  9.19%)
      都错误:  6474/ 7835 ( 82.63%)
    强度级别统计:
      都正确:   291/ 7835 (  3.71%)
      仅8B正确:   951/ 7835 ( 12.14%)
      仅Ablation正确:  1088/ 7835 ( 13.89%)
      都错误:  5505/ 7835 ( 70.26%)
  vali 数据集:
    Step级别统计:
      都正确:    81/ 7120 (  1.14%)
      仅8B正确:   460/ 7120 (  6.46%)
      仅Ablation正确:   691/ 7120 (  9.71%)
      都错误:  5888/ 7120 ( 82.70%)
    强度级别统计:
      都正确:   286/ 7120 (  4.02%)
      仅8B正确:   849/ 7120 ( 11.92%)
      仅Ablation正确:  1033/ 7120 ( 14.51%)
      都错误:  4952/ 7120 ( 69.55%)
  train 数据集:
    Step级别统计:
      都正确:   339/34210 (  0.99%)
      仅8B正确:  2371/34210 (  6.93%)
      仅Ablation正确:  3002/34210 (  8.78%)
      都错误: 28498/34210 ( 83.30%)
    强度级别统计:
      都正确:  1209/34210 (  3.53%)
      仅8B正确:  4292/34210 ( 12.55%)
      仅Ablation正确:  4718/34210 ( 13.79%)
      都错误: 23991/34210 ( 70.13%)

数据集类型: trendonly
--------------------------------------------------
  test 数据集:
    Step级别统计:
      都正确:  1597/ 7835 ( 20.38%)
      仅8B正确:  1549/ 7835 ( 19.77%)
      仅Ablation正确:  2404/ 7835 ( 30.68%)
      都错误:  2285/ 7835 ( 29.16%)
  vali 数据集:
    Step级别统计:
      都正确:  1481/ 7120 ( 20.80%)
      仅8B正确:  1393/ 7120 ( 19.56%)
      仅Ablation正确:  2144/ 7120 ( 30.11%)
      都错误:  2102/ 7120 ( 29.52%)
  train 数据集:
    Step级别统计:
      都正确:  6849/34210 ( 20.02%)
      仅8B正确:  7061/34210 ( 20.64%)
      仅Ablation正确:  9988/34210 ( 29.20%)
      都错误: 10312/34210 ( 30.14%)

数据集类型: globalonly
--------------------------------------------------
  test 数据集:
    Record级别统计:
      都正确:   625/ 1567 ( 39.89%)
      仅8B正确:   447/ 1567 ( 28.53%)
      仅Ablation正确:   289/ 1567 ( 18.44%)
      都错误:   206/ 1567 ( 13.15%)
  vali 数据集:
    Record级别统计:
      都正确:   545/ 1424 ( 38.27%)
      仅8B正确:   400/ 1424 ( 28.09%)
      仅Ablation正确:   278/ 1424 ( 19.52%)
      都错误:   201/ 1424 ( 14.12%)
  train 数据集:
    Record级别统计:
      都正确:  2707/ 6842 ( 39.56%)
      仅8B正确:  1869/ 6842 ( 27.32%)
      仅Ablation正确:  1296/ 6842 ( 18.94%)
      都错误:   970/ 6842 ( 14.18%)

数据集类型: trendstrength_onlyts
--------------------------------------------------
  test 数据集:
    Step级别统计:
      都正确:   239/ 7835 (  3.05%)
      仅8B正确:   402/ 7835 (  5.13%)
      仅Ablation正确:   489/ 7835 (  6.24%)
      都错误:  6705/ 7835 ( 85.58%)
    强度级别统计:
      都正确:   566/ 7835 (  7.22%)
      仅8B正确:   676/ 7835 (  8.63%)
      仅Ablation正确:   864/ 7835 ( 11.03%)
      都错误:  5729/ 7835 ( 73.12%)
  vali 数据集:
    Step级别统计:
      都正确:   225/ 7120 (  3.16%)
      仅8B正确:   316/ 7120 (  4.44%)
      仅Ablation正确:   471/ 7120 (  6.62%)
      都错误:  6108/ 7120 ( 85.79%)
    强度级别统计:
      都正确:   547/ 7120 (  7.68%)
      仅8B正确:   588/ 7120 (  8.26%)
      仅Ablation正确:   859/ 7120 ( 12.06%)
      都错误:  5126/ 7120 ( 71.99%)
  train 数据集:
    Step级别统计:
      都正确:   994/34210 (  2.91%)
      仅8B正确:  1716/34210 (  5.02%)
      仅Ablation正确:  2224/34210 (  6.50%)
      都错误: 29276/34210 ( 85.58%)
    强度级别统计:
      都正确:  2462/34210 (  7.20%)
      仅8B正确:  3039/34210 (  8.88%)
      仅Ablation正确:  4137/34210 ( 12.09%)
      都错误: 24572/34210 ( 71.83%)

数据集类型: trendonly_onlyts
--------------------------------------------------
  test 数据集:
    Step级别统计:
      都正确:  2689/ 7835 ( 34.32%)
      仅8B正确:   457/ 7835 (  5.83%)
      仅Ablation正确:  1072/ 7835 ( 13.68%)
      都错误:  3617/ 7835 ( 46.16%)
  vali 数据集:
    Step级别统计:
      都正确:  2377/ 7120 ( 33.38%)
      仅8B正确:   497/ 7120 (  6.98%)
      仅Ablation正确:  1010/ 7120 ( 14.19%)
      都错误:  3236/ 7120 ( 45.45%)
  train 数据集:
    Step级别统计:
      都正确: 11753/34210 ( 34.36%)
      仅8B正确:  2157/34210 (  6.31%)
      仅Ablation正确:  4648/34210 ( 13.59%)
      都错误: 15652/34210 ( 45.75%)

数据集类型: globalonly_onlyts
--------------------------------------------------
  test 数据集:
    Record级别统计:
      都正确:   909/ 1567 ( 58.01%)
      仅8B正确:   163/ 1567 ( 10.40%)
      仅Ablation正确:   197/ 1567 ( 12.57%)
      都错误:   298/ 1567 ( 19.02%)
  vali 数据集:
    Record级别统计:
      都正确:   759/ 1424 ( 53.30%)
      仅8B正确:   186/ 1424 ( 13.06%)
      仅Ablation正确:   169/ 1424 ( 11.87%)
      都错误:   310/ 1424 ( 21.77%)
  train 数据集:
    Record级别统计:
      都正确:  3883/ 6842 ( 56.75%)
      仅8B正确:   693/ 6842 ( 10.13%)
      仅Ablation正确:   813/ 6842 ( 11.88%)
      都错误:  1453/ 6842 ( 21.24%)
