Method;acute-inflammation;acute-nephritis;annealing;arrhythmia;audiology-std;balance-scale;balloons;bank;blood;breast-cancer;breast-cancer-wisc;breast-cancer-wisc-prog;breast-tissue;congressional-voting;conn-bench-sonar-mines-rocks;conn-bench-vowel-deterding;credit-approval;cylinder-bands;dermatology;echocardiogram;ecoli;energy-y1;energy-y2;fertility;flags;glass;haberman-survival;hayes-roth;heart-cleveland;heart-hungarian;heart-switzerland;heart-va;hepatitis;horse-colic;ilpd-indian-liver;ionosphere;iris;lenses;letter;low-res-spect;lung-cancer;lymphography;mammographic;molec-biol-promoter;monks-1;monks-2;monks-3;musk-1;oocytes_trisopterus_nucleus_2f;oocytes_trisopterus_states_5b;parkinsons;pima;pittsburg-bridges-MATERIAL;pittsburg-bridges-REL-L;pittsburg-bridges-SPAN;pittsburg-bridges-T-OR-D;pittsburg-bridges-TYPE;planning;post-operative;primary-tumor;seeds;soybean;spect;spectf;statlog-australian-credit;statlog-heart;statlog-vehicle;synthetic-control;teaching;tic-tac-toe;trains;vertebral-column-2clases;vertebral-column-3clases;wine;zoo
SNNs (deep networks: Self-Normalizing Networks) ;100;100;76;65.49;80;92.31;100;89.03;77.01;71.83;97.14;67.35;73.08;61.47;78.85;99.57;84.3;72.66;92.31;81.82;89.29;95.83;90.63;92;45.83;73.58;73.68;67.86;61.84;79.45;35.48;36;76.92;80.88;69.86;88.64;97.3;66.67;97.26;85.71;62.5;91.89;82.5;84.62;75.23;59.26;60.42;87.39;79.82;93.42;89.8;75.52;88.46;69.23;69.57;84;65.38;68.89;72.73;52.44;88.46;85.11;63.98;49.73;59.88;92.54;80.09;98.67;50;96.65;NA;83.12;83.12;97.73;92
MS (deep networks with MSRA initialization);100;100;73;63.72;68;92.31;50;88.76;77.54;69.01;97.14;73.47;46.15;60.55;82.69;99.35;84.3;76.56;91.21;84.85;83.33;95.83;89.58;88;45.83;60.38;72.37;46.43;60.53;83.56;38.71;26;76.92;85.29;66.44;90.91;91.89;100;97.12;84.96;37.5;72.97;80.83;76.92;65.51;63.43;74.54;86.55;87.28;94.3;91.84;76.56;84.62;76.92;52.17;88;65.38;66.67;72.73;50;86.54;87.23;61.83;60.43;68.02;83.58;82.94;98;60.53;98.33;NA;87.01;80.52;93.18;100
HW (deep networks: Highway Networks);100;100;36;62.83;72;91.03;25;88.85;79.68;74.65;97.71;83.67;61.54;58.72;84.62;97.84;85.47;79.69;97.8;60.61;86.9;88.02;90.1;88;43.75;64.15;64.47;78.57;63.16;79.45;58.06;40;66.67;77.94;67.81;94.32;83.78;100;89.84;90.23;12.5;72.97;79.17;69.23;58.33;63.89;58.8;89.92;82.89;93.42;83.67;71.88;92.31;69.23;56.52;88;53.85;60;59.09;45.12;94.23;86.17;60.22;89.3;68.02;77.61;79.62;98.67;52.63;97.49;NA;85.71;79.22;90.91;88
ResNet (deep networks: Residual Networks);100;100;26;64.6;80;91.67;100;87.96;80.21;74.65;97.14;81.63;42.31;59.63;80.77;99.35;84.3;77.34;92.31;84.85;82.14;81.77;87.5;84;37.5;64.15;68.42;71.43;56.58;80.82;32.26;26;76.92;80.88;67.12;95.45;97.3;66.67;97.62;86.47;25;67.57;78.33;76.92;75.46;62.73;58.33;87.39;77.19;89.47;91.84;71.35;92.31;84.62;56.52;88;65.38;71.11;72.73;39.02;86.54;86.7;66.67;70.05;63.95;86.57;75.83;96;55.26;96.23;NA;83.12;75.32;97.73;100
BN (deep networks with Batch Normalization);100;100;12;59.29;64;92.31;100;88.23;76.47;73.24;98.29;77.55;46.15;58.72;71.15;96.1;87.21;75;93.41;84.85;82.14;86.46;87.5;68;41.67;58.49;73.68;75;57.89;84.93;38.71;28;87.18;85.29;59.59;94.32;91.89;83.33;97.96;85.71;50;75.68;81.67;76.92;90.74;32.87;52.78;82.35;74.56;89.47;85.71;71.88;88.46;76.92;56.52;88;11.54;62.22;59.09;51.22;86.54;88.83;63.44;22.99;68.02;79.1;75.83;97.33;50;98.33;50;83.12;77.92;97.73;72
WN (deep networks with Weight Normalization) ;100;100;65;60.18;72;95.51;0;88.5;75.94;61.97;96.57;83.67;53.85;58.72;82.69;95.24;90.7;75.78;94.51;78.79;84.52;90.1;89.06;68;41.67;67.92;75;57.14;56.58;75.34;25.81;22;84.62;70.59;69.18;93.18;100;83.33;95.8;88.72;50;75.68;82.92;69.23;50;66.44;52.31;89.92;79.39;92.54;81.63;69.79;80.77;65.38;65.22;88;46.15;64.44;54.55;50;88.46;85.37;63.98;45.45;68.6;86.57;80.09;98.67;31.58;97.07;50;66.23;74.03;97.73;96
LN  (deep networks with Layer Normalization);90;100;50;57.52;80;98.72;75;89.2;71.12;66.2;97.14;79.59;57.69;57.8;67.31;99.35;85.47;75.78;94.51;81.82;85.71;94.79;88.02;88;35.42;69.81;68.42;89.29;57.89;84.93;51.61;24;74.36;79.41;69.86;94.32;97.3;66.67;97.42;89.47;25;78.38;82.08;46.15;70.14;51.62;69.91;89.92;82.02;89.91;85.71;69.27;92.31;73.08;60.87;88;65.38;68.89;77.27;45.12;88.46;84.84;67.2;55.61;62.79;79.1;79.15;97.33;63.16;97.91;100;84.42;83.12;97.73;96
Bagging;92.5;100;82;65;44;83.8;62.5;90.4;75.9;70.1;96.9;73;68.3;61.7;77.4;82.5;86.5;69.9;93.5;85.6;83;92.2;89.1;88;63.5;64.8;72.4;60.7;59.9;81.1;43.5;35;81.4;60.3;71.9;90.3;95.4;66.7;NA;88.3;50;77.7;80.9;82.7;66.7;67.1;52.8;74.4;73.2;87.2;83.7;76.3;85.6;72.1;63;84.6;60.6;69.6;72.7;49.1;88.5;53.5;71.1;92;68;83.8;72.5;93.2;47.4;93.9;50;82.7;83.3;93.2;86
Bayesian methods;100;95;84;62.1;84;90;56.2;83.7;75;73.7;95.9;72.2;63.2;58.8;69.2;76.1;77.8;67.1;97.2;80.1;85.7;82.4;82.9;87;46.9;47.1;75.4;64.2;57;82.6;36.5;33;82.5;72;55.5;81.7;94.6;54.1;64;80.4;59.3;83.1;78.5;87.7;59.2;66.8;66.4;74.7;52.1;76;69.2;76.1;83.9;63.1;71.7;89.2;57.1;59.3;62.2;43.9;89.5;86.7;55;91.9;54.6;84.4;46;94.3;52.9;70.1;60;78;83.5;97.1;96
Boosting;100;100;94;72.1;68;87;56.2;89.6;76.4;73.7;95.2;73.2;63.2;60.2;75.9;80.9;86.2;70.8;97.2;81.6;82.1;90.7;90.2;88;61.8;71.9;73.8;85.7;59.4;81.2;37.3;32.5;78.7;79.4;69.4;91.4;94.6;83.3;73.7;87;53.1;81;82.9;83.9;60.1;66.6;52.7;77.3;73.2;88.3;85.6;74.3;83;63.1;64.1;90.1;60;62.6;64.4;49.3;91.9;90.9;55;91.9;67.6;80.7;69.8;94.1;53.6;72.9;60;84.5;80.3;96.6;96
Decision Tree;91.7;96.7;88;71.2;64;79.7;89.4;89.9;79.3;72.4;93.6;73.8;65.9;61.6;76.5;76.6;85.6;70.1;93.4;85.4;81;94.1;91.3;87;58.3;69.2;70.9;89.3;56.7;79.9;40.7;31.4;74.8;85.3;70.8;87.5;95.3;62.6;47.2;82.1;46.9;74.9;82.4;74.5;61.1;64.8;52.8;74;75.8;87.6;86.7;74.7;86.8;70.8;59.8;80.3;58.2;59.4;74.2;46.7;89.5;71.8;55.1;90.9;69.1;78.5;68.1;86.7;50.9;92.2;98;82.9;81.3;89.9;86.2
DA (Discriminant Analysis);100;100;89;45.1;52;88.8;56.2;89.2;77;71.2;95.9;73;70.2;61.9;71.2;84.2;86.6;75.8;95.7;83.3;84.5;84.6;84.2;85;46.9;64.8;74.3;67.9;55.6;80.1;39.5;35;81.4;80.9;72.9;86.6;98.7;87.5;80.5;85.3;37.5;79.1;77.9;74;67.6;66.7;63.4;78.8;76.5;91.2;89.8;75.5;76;67.3;68.5;88.5;64.4;64.1;58;37.8;94.2;86.2;56.7;84.5;66.3;80.9;81.8;98.3;46.7;97.6;75;82.4;84;98.9;96
GLM (Generalized Linear Models);100;100;76;48;60;46.1;68.8;89.4;77.3;70.3;96.9;81.3;28.3;60.7;75;16.9;85.7;72.3;47;80.2;63.1;59;73.6;86;30.9;47.3;74.5;60.7;58.1;83.4;38.2;29.5;80.7;86.8;73.4;89.5;66.7;33.2;7.2;63.5;39.7;54.7;82.6;77.2;59;67.4;56.2;86.3;80.3;56.7;86.7;77.1;17;33.1;62.1;86.3;18.1;71.4;65.7;20.6;63.3;5.9;59.9;92;66.4;85.6;49.1;17;41;98.3;87.5;84.2;39;73;60.4
LMR (Logistic and Multinomial Regression);100;100;92;72.3;76;88;31.2;89.4;77.1;73.7;96.1;74.7;66.9;60.4;74.5;82;84.9;70.7;97.2;85.4;86.9;88.6;86.7;88;52;62.1;74.1;60.7;59;80.6;34.1;34.5;80;91.1;71.5;87.4;95.3;79.1;77.4;90.5;62.5;79.7;82.3;81.1;63.8;67.1;56.9;82.1;76.5;92.6;84.1;76.6;86.7;63.1;69.5;85.2;55.2;71.4;71.1;46.9;95.2;90.9;58.8;91.4;67.8;83.3;78;98.5;52.3;97.5;50;85.1;85.1;98.3;96
MARS (Multivariate Adaptive Regression Splines);100;100;88;68.8;12;91.2;44.2;89.8;78.1;76.2;96.3;70.3;62.1;62.8;66.3;76;86.9;71.9;95.4;80.9;82.4;95.6;91.3;86;66;67.4;74.5;85.7;56.4;82.3;39.1;30.5;80;80.9;71.2;83.2;95.2;74.5;78.3;81.6;47.6;80.4;83;87.7;58.3;67.1;52.8;81.9;80.8;93.4;88.7;77.7;86.8;70.9;65.3;88.2;53.5;71.4;71.1;44.2;91.9;90.4;57.8;85.6;68;82.6;78.4;94.2;43.2;98;75;83.3;84.5;99.4;95
Nearest Neighbour;100;100;96;68.1;68;79.2;56.2;88;68.3;68.8;96.8;76.7;70.7;56.7;70.6;94.1;86.5;69.7;95.6;83.9;82.1;95.7;92.9;86;56.7;68.2;68.9;82.1;52.8;77.8;34.9;30.5;77.4;82.3;68.2;89.1;96.6;70.8;90.6;84.3;68.7;78.3;73.6;77.3;61.1;65;61.1;80.2;68.4;84.6;86.1;72.6;84.9;62.1;65.2;81.3;55.2;65.3;53.3;36.9;89.5;88;59.3;91.9;61.1;76.2;60.8;97.6;62.2;89.7;70;80.9;76.4;93.8;95
Neural Networks;96;100;89;62.6;48;85.9;71.2;88.9;76.2;73.8;96.6;79.3;67.1;61.4;88;91.6;85.4;73.6;96.2;84;86.6;86.5;86.7;88;46.3;64.6;73.9;50;60.4;84.7;47.2;37.1;89.7;82.4;69.8;86.9;94.6;76;83.7;86.1;73.4;82.5;79.6;84.9;66.9;67.8;53.7;86.6;68.3;88.4;89.7;75.4;86.8;70.9;74;90.2;58.2;69.8;71.1;44;93.3;84.8;55.6;89.8;68.8;84.1;67.1;98.3;53.6;75.5;79.6;77.1;81;97.8;93.2
Other Ensembles;97.5;100;84;60.6;52;88.4;62.5;88.4;76.2;72.7;96.2;76.7;57.5;61.3;76.9;48.7;85.6;70.8;96.4;83.9;74.1;81.5;83.9;88;47.9;51.4;73.8;60.7;58.7;81.2;31.7;33.5;82.5;91.1;71.3;82.6;87.3;62.5;72.7;86.6;43.7;82.4;81;83;61.5;67.1;71.7;80.2;69.9;86.6;85.6;73.4;85.8;68.9;63;86.2;53.3;71.4;71.1;45.1;91.4;71.5;55;91.9;67.6;82.9;65.4;96.8;49;81.2;40;70.3;71.2;96.6;78.2
Other Methods;100;92.4;83;71.5;52;88.2;56.7;88.5;76.6;70.6;95.4;77.3;58.4;61.4;72.6;62.1;84.2;66.2;96.2;82.4;80.4;81.2;88.5;88;50;55.6;73.5;64.3;57.1;82.3;43.1;33.5;80.7;83.8;71.4;84;93.3;62.6;58;76.8;59.8;82.5;80;83;60.2;67.1;52.8;73.7;60.5;78.7;82.6;71;79.3;68.1;63;86.3;49.5;71.4;71.1;44;90;83.8;57.2;92;67.8;84.8;44.9;90;56.3;65.3;83.3;72.3;70.3;97.2;95.1
PLSR (Partial Least Squares and Principal Component Regression) ;100;99.2;79;23.2;12;84;87.5;89.2;76.9;69.1;95.9;79;38.5;62.2;75;18;86.2;75;67.9;86.4;52.1;87.8;82.6;88;21.9;48.6;74;53.6;49.7;85.8;42.7;37.5;80.8;86.8;71.9;85.8;97.4;66.7;5.2;54.1;59.4;85.1;79;82.7;58.8;67.4;53.9;78.6;75.9;67.3;87.8;78.8;69.2;40.4;70.7;85.6;34.6;69;25;9.8;74.5;21.3;57.2;90.4;67.4;87.1;48.8;38.7;34.9;97.6;87.5;82.1;67.3;92.6;87
Random Forest;100;100;94;73.5;52;81.8;81.2;89.7;73.8;64;96.3;81.3;67.9;60.7;78.9;93.9;86.8;79.3;97;84.7;86;97.5;92.7;85;69.6;78.5;69.3;89.3;56.4;81.3;39;33.5;79.3;82.4;69.5;92.3;96;78.9;94.5;89.5;50.8;82.4;80;81.1;61.1;65.7;53.7;87.8;81.7;91;90.8;76.7;83.1;67;70.6;89.2;53.3;66;64.6;43.1;94.7;NA;55.6;92;68.7;79.6;76.5;97.3;57;99;87.5;83.5;83.9;94.9;97.1
Rule-based Methods;99.2;100;79;73.5;8;82.4;72.5;90;77.7;72.4;96;75.2;63.6;61.8;76.4;72.3;85.4;73;92.9;85.5;81.6;95.8;91.3;88;59.8;65.4;74.5;50;56.4;79.6;40.6;32;82.6;75;69.8;89.8;95.3;78.1;87;84.4;72;77;82.5;79.3;50;59.7;52.8;74.6;74.1;88.2;91.8;76.2;86.8;70.9;60.9;86.3;55.3;71.4;71.1;40;91.5;46.5;55.1;89.3;68.1;80;68.7;83.5;44.4;98.3;41.7;83.2;80.6;92.7;90.2
Stacking (Wolpert);50.8;58.3;76;54.2;0;46;56.2;88.4;76.2;70.2;65.5;76.2;18.8;61.3;53.3;9;55.5;60.9;30.6;67.1;42.5;46.8;49.8;88;30.9;35.5;73.5;50;54.1;63.9;39;28;79.3;60.2;71.3;64.1;32;62.5;4;51.9;40.6;54.7;53.6;49;50;67.1;47.2;56.5;57.7;57.5;75.3;65.1;74.5;51.4;52.1;86.2;41.9;71.4;71.1;25.4;32.3;12.7;55;8;67.8;55.5;25.7;16.6;34.4;65.3;NA;67.7;48.3;39.8;40.5
SVM (Support Vector Machines);100;98.3;76;69.9;64;98.4;56.2;89.6;78.7;73.7;95.5;78.2;67.9;60.6;88.9;100;85.6;76.9;97.2;85.4;86.9;96.3;92.4;87;50;68.2;73.5;75;56.4;81.9;34.9;33;81.2;66.1;68.6;94;94;79.1;97.4;90.7;50;85.1;82.9;80.1;51.8;65.2;53.2;90.3;79.7;91.7;93.8;75.9;83.9;67.9;70.6;84.3;60;71.4;70;47.2;94.7;48.6;54.8;91.9;67.6;84.4;83.2;99.1;55.6;99.4;40;85.4;85.8;97.7;96
Hopfield (modern Hopfield networks with layer HOPFIELD);100;100;75;64.6;80;98.08;75;74.33;67.61;98.29;98.59;71.43;76.92;60.55;73.08;99.57;81.4;72.66;96.7;87.88;90.48;95.31;91.15;88;45.83;69.81;75;78.57;59.21;79.45;51.61;42;87.18;85.29;69.18;89.77;97.3;50;81.11;90.98;37.5;94.59;81.25;84.62;75.69;66.44;70.14;87.39;78.07;96.05;93.88;72.4;84.62;76.92;65.22;84;65.38;66.67;72.73;58.54;96.15;89.1;63.98;56.15;69.19;91.04;82.46;99.33;55.26;97.91;100;85.71;80.52;97.73;100
;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;
"# For details on compared methods see Experiments section and Appendix Section A4 in: Klambauer, G., et al. ""Self-normalizing neural networks."" Advances in neural information processing systems. 2017. (https://arxiv.org/pdf/1706.02515.pdf)";;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;
