{
  "baselines": {
    "keyword_heuristic": {
      "accuracy": 0.375,
      "macro_f1": 0.23492063492063495,
      "top1_accuracy": 0.375,
      "top3_accuracy": 0.7083333333333334,
      "top5_accuracy": 0.7083333333333334
    },
    "majority_class": {
      "accuracy": 0.375,
      "macro_f1": 0.0606060606060606,
      "top1_accuracy": 0.375,
      "top3_accuracy": 0.4583333333333333,
      "top5_accuracy": 0.7083333333333334
    },
    "text_naive_bayes": {
      "accuracy": 0.5416666666666666,
      "macro_f1": 0.14666666666666667,
      "top1_accuracy": 0.5416666666666666,
      "top3_accuracy": 0.6666666666666666,
      "top5_accuracy": 0.75
    },
    "tfidf_linear_svm": {
      "accuracy": 0.375,
      "macro_f1": 0.20979020979020976,
      "top1_accuracy": 0.375,
      "top3_accuracy": 0.625,
      "top5_accuracy": 0.7083333333333334
    },
    "tfidf_logistic_regression": {
      "accuracy": 0.3333333333333333,
      "macro_f1": 0.1724025974025974,
      "top1_accuracy": 0.3333333333333333,
      "top3_accuracy": 0.625,
      "top5_accuracy": 0.6666666666666666
    }
  },
  "label_distribution": {
    "all_goals": 1,
    "apply": 6,
    "assumption": 1,
    "by_contra": 1,
    "cases": 2,
    "constructor": 5,
    "contradiction": 1,
    "decide": 3,
    "exact": 23,
    "grind": 1,
    "have": 7,
    "intro": 12,
    "left": 1,
    "linarith": 1,
    "obtain": 1,
    "refine": 2,
    "rfl": 2,
    "right": 1,
    "ring": 3,
    "rintro": 6,
    "rw": 12,
    "simp": 9,
    "simp_all": 3,
    "simp_rw": 3,
    "simpa": 2
  },
  "representation": "structured",
  "split": {
    "n_rows": 109,
    "n_test": 24,
    "n_test_theorems": 10,
    "n_train": 85,
    "n_train_theorems": 25,
    "seed": 0,
    "strategy": "theorem-level random split",
    "test_ratio": 0.3,
    "test_theorems": [
      "Irrational.ne_rational",
      "LeanResearch.Nat.primeFactorsList_unique_fixed",
      "LeanResearch.and_true_simp",
      "LeanResearch.double_neg",
      "LeanResearch.fundamental_theorem_of_algebra",
      "LeanResearch.imp_trans",
      "LeanResearch.irrational_sqrt_two",
      "LeanResearch.or_comm",
      "LeanResearch.or_intro_left",
      "exists_rat_of_not_irrational"
    ]
  }
}