skill,score,count,avg
robustness,37.0,13,2.8461538461538463
correctness,60.0,27,2.2222222222222223
efficiency,55.0,16,3.4375
factuality,81.0,26,3.1153846153846154
commonsense,113.0,40,2.825
comprehension,205.0,59,3.4745762711864407
insightfulness,41.0,12,3.4166666666666665
completeness,69.0,18,3.8333333333333335
metacognition,80.0,19,4.2105263157894735
readability,59.0,12,4.916666666666667
conciseness,52.0,12,4.333333333333333
harmlessness,58.0,12,4.833333333333333
