Model,Method,FNR_Change_pp,Original_FNR,Paraphrase_FNR
Llama-4-Scout,BERTScore,-6.428571428571428,0.6,0.5357142857142857
Llama-4-Scout,Embedding Variance,6.547619047619047,0.6666666666666667,0.7321428571428572
Llama-4-Scout,Levenshtein Variance,-0.8333333333333304,0.8833333333333333,0.875
Llama-4-Scout,Semantic Entropy (τ=0.2),-4.642857142857137,0.85,0.8035714285714286
Llama-4-Scout,Semantic Entropy (τ=0.1),-5.35714285714286,1.0,0.9464285714285714
Qwen-2.5-7B,BERTScore,-6.309523809523809,0.8666666666666667,0.8035714285714286
Qwen-2.5-7B,Embedding Variance,-2.0238095238095277,0.9666666666666667,0.9464285714285714
Qwen-2.5-7B,Levenshtein Variance,9.04761904761906,0.7666666666666666,0.8571428571428572
Qwen-2.5-7B,Semantic Entropy (τ=0.2),1.6666666666666718,0.9833333333333333,1.0
Qwen-2.5-7B,Semantic Entropy (τ=0.1),0.0,1.0,1.0
