skill,score,count,avg
robustness,43.0,13,3.3076923076923075
correctness,81.0,27,3.0
efficiency,64.0,16,4.0
factuality,85.0,25,3.4
commonsense,153.0,40,3.825
comprehension,227.0,59,3.847457627118644
insightfulness,50.0,12,4.166666666666667
completeness,74.0,18,4.111111111111111
metacognition,77.0,18,4.277777777777778
readability,59.0,12,4.916666666666667
conciseness,55.0,12,4.583333333333333
harmlessness,59.0,12,4.916666666666667
