[
    {
        "test": "limited-list-referents-from-selection-criteria",
        "responder": "qwen-v2.5-14b-instruct",
        "concept": "approved drug for breast cancer",
        "domain": "medicine",
        "response": [
            "Tamoxifen (TAM)",
            "Anastrozole (ANA)",
            "Letrozole (LET)",
            "Exemestane (EXE)",
            "Ovarian ablation",
            "Palbociclib (PAL)",
            "Ibrance",
            "Fulvestrant (FUL)",
            "Afinitor (Everolimus)",
            "Neratinib (NIRA)",
            "Toremifene (TOR)",
            "Abemaciclib (ABE)",
            "Lynparza (Olaparib)",
            "Kisqali (Ribociclib)",
            "Ixabepilone (IXA)",
            "T-DM1 (Trastuzumab emtansine)",
            "Trastuzumab (Herceptin)",
            "Pertuzumab (Perjeta)",
            "Alpelisib (ALP)",
            "Everolimus (RAD001)",
            "Lumacaftor (LUM)",
            "Sacituzumab govitecan (SG)",
            "Enhertu (Fam-trastuzumab deruxtecan-nxki)"
        ],
        "scorer": "gpt-4o",
        "judgement": {
            "matches": [
                "Anastrozole (ANA)",
                "Letrozole (LET)",
                "Exemestane (EXE)",
                "Palbociclib (PAL)",
                "Ibrance",
                "Fulvestrant (FUL)",
                "Afinitor (Everolimus)",
                "Lynparza (Olaparib)",
                "Kisqali (Ribociclib)",
                "Ixabepilone (IXA)",
                "Trastuzumab (Herceptin)",
                "Pertuzumab (Perjeta)",
                "Alpelisib (ALP)",
                "Enhertu (Fam-trastuzumab deruxtecan-nxki)"
            ],
            "mismatches": [
                "Tamoxifen (TAM)",
                "Ovarian ablation",
                "Neratinib (NIRA)",
                "Toremifene (TOR)",
                "Abemaciclib (ABE)",
                "Everolimus (RAD001)",
                "Lumacaftor (LUM)",
                "Sacituzumab govitecan (SG)",
                "T-DM1 (Trastuzumab emtansine)"
            ],
            "true_referents": [
                "Abemaciclib",
                "Ado-Trastuzumab Emtansine",
                "Afinitor (Everolimus)",
                "Afinitor Disperz (Everolimus)",
                "Alpelisib",
                "Anastrozole",
                "Arimidex (Anastrozole)",
                "Aromasin (Exemestane)",
                "Enhertu (Fam-Trastuzumab Deruxtecan-nxki)",
                "Everolimus",
                "Exemestane",
                "Fam-Trastuzumab Deruxtecan-nxki",
                "Fareston (Toremifene)",
                "Faslodex (Fulvestrant)",
                "Femara (Letrozole)",
                "Fulvestrant",
                "Herceptin (Trastuzumab)",
                "Herceptin Hylecta (Trastuzumab and Hyaluronidase-oysk)",
                "Ibrance (Palbociclib)",
                "Ixabepilone",
                "Ixempra (Ixabepilone)",
                "Kisqali (Ribociclib Succinate)",
                "Kisqali Femara Co-Pack (Ribociclib Succinate and Letrozole)",
                "Letrozole",
                "Lynparza (Olaparib)",
                "Neratinib Maleate",
                "Olaparib",
                "Paclitaxel",
                "Palbociclib",
                "Perjeta (Pertuzumab)",
                "Pertuzumab",
                "Pertuzumab, Trastuzumab, and Hyaluronidase-zzxf",
                "Piqray (Alpelisib)",
                "Ribociclib Succinate",
                "Sacituzumab Govitecan-hziy",
                "Soltamox (Tamoxifen Citrate)",
                "Talzenna (Talazoparib Tosylate)",
                "Tamoxifen Citrate",
                "Toremifene",
                "Trastuzumab",
                "Trodelvy (Sacituzumab Govitecan-hziy)",
                "Tucatinib",
                "Verzenio (Abemaciclib)"
            ],
            "TP": 14,
            "FP": 9,
            "FN": 0
        }
    },
    {
        "test": "limited-list-referents-from-selection-criteria",
        "responder": "phi-v4",
        "concept": "approved drug for breast cancer",
        "domain": "medicine",
        "response": [
            "Anastrozole (Arimidex)",
            "Bicalutamide (Casodex)",
            "Bisphosphonates (e.g., Zoledronic acid, Zometa)",
            "Cabazitaxel (Jevtana)",
            "Cyclophosphamide (Cytoxan)",
            "Doxorubicin (Adriamycin)",
            "Eribulin (Halaven)",
            "Fluorouracil (5-FU)",
            "Goserelin (Zoladex)",
            "Ixabepilone (Ixempra)",
            "Letrozole (Femara)",
            "Leuprolide (Lupron)",
            "Megestrol acetate (Megace)",
            "Methotrexate (Trexall)",
            "Mitomycin C (Mutamycin)",
            "Paclitaxel (Taxol)",
            "Tamoxifen (Nolvadex)",
            "Trastuzumab (Herceptin)",
            "Vandetanib (Caprelsa)",
            "Vinorelbine (Navelbine)",
            "Exemestane (Aromasin)",
            "Everolimus (Afinitor)",
            "Palbociclib (Ibrance)",
            "Ribociclib (Kisqali)"
        ],
        "scorer": "gpt-4o",
        "judgement": {
            "matches": [
                "Anastrozole",
                "Cyclophosphamide",
                "Doxorubicin",
                "Eribulin",
                "Fluorouracil",
                "Goserelin",
                "Ixabepilone",
                "Letrozole",
                "Megestrol acetate",
                "Methotrexate",
                "Paclitaxel",
                "Tamoxifen",
                "Trastuzumab",
                "Exemestane",
                "Everolimus",
                "Palbociclib",
                "Ribociclib"
            ],
            "mismatches": [
                "Bicalutamide (Casodex)",
                "Bisphosphonates (e.g., Zoledronic acid, Zometa)",
                "Cabazitaxel (Jevtana)",
                "Leuprolide (Lupron)",
                "Mitomycin C (Mutamycin)",
                "Vandetanib (Caprelsa)",
                "Vinorelbine (Navelbine)"
            ],
            "true_referents": [
                "5-FU (Fluorouracil Injection)",
                "Ado-Trastuzumab Emtansine",
                "Afinitor (Everolimus)",
                "Afinitor Disperz (Everolimus)",
                "Anastrozole",
                "Aredia (Pamidronate Disodium)",
                "Arimidex (Anastrozole)",
                "Aromasin (Exemestane)",
                "Capecitabine",
                "Capivasertib",
                "Cyclophosphamide",
                "Docetaxel",
                "Doxorubicin Hydrochloride",
                "Eribulin Mesylate",
                "Everolimus",
                "Exemestane",
                "Faslodex (Fulvestrant)",
                "Femara (Letrozole)",
                "Fluorouracil Injection",
                "Goserelin Acetate",
                "Halaven (Eribulin Mesylate)",
                "Herceptin (Trastuzumab)",
                "Ibrance (Palbociclib)",
                "Ixabepilone",
                "Ixempra (Ixabepilone)",
                "Kisqali (Ribociclib Succinate)",
                "Kisqali Femara Co-Pack (Ribociclib Succinate and Letrozole)",
                "Letrozole",
                "Megestrol Acetate",
                "Methotrexate Sodium",
                "Paclitaxel",
                "Palbociclib",
                "Pamidronate Disodium",
                "Ribociclib Succinate",
                "Tamoxifen Citrate",
                "Taxotere (Docetaxel)",
                "Trastuzumab",
                "Tucatinib",
                "Vinblastine Sulfate",
                "Zoladex (Goserelin Acetate)"
            ],
            "TP": 17,
            "FP": 7,
            "FN": 0
        }
    },
    {
        "test": "limited-list-referents-from-selection-criteria",
        "responder": "mistral-small-instruct-24B",
        "concept": "approved drug for breast cancer",
        "domain": "medicine",
        "response": [
            "Tamoxifen (Nolvadex)",
            "Anastrozole (Arimidex)",
            "Letrozole (Femara)",
            "Exemestane (Aromasin)",
            "Fulvestrant (Faslodex)",
            "Raloxifene (Evista)",
            "Palbociclib (Ibrance)",
            "Ribociclib (Kisqali)",
            "Abemaciclib (Verzenio)",
            "Olaparib (Lynparza)",
            "Trastuzumab (Herceptin)",
            "Pertuzumab (Perjeta)",
            "Lapatinib (Tykerb)",
            "Everolimus (Afinitor)",
            "T-DM1 (Ado-trastuzumab emtansine, Kadcyla)",
            "Neratinib (Nerlynx)",
            "Capivasertib",
            "Buparlisib",
            "Alpelisib",
            "Tucatinib (Tukysa)",
            "Sacituzumab govitecan (Trodelvy)",
            "Sacituzumab govitecan (Trodelvy)",
            "Enzalutamide (Xtandi)"
        ],
        "scorer": "gpt-4o",
        "judgement": {
            "matches": [
                "Anastrozole",
                "Letrozole",
                "Exemestane",
                "Fulvestrant",
                "Palbociclib",
                "Ribociclib Succinate",
                "Abemaciclib",
                "Olaparib",
                "Trastuzumab",
                "Pertuzumab",
                "Lapatinib Ditosylate",
                "Everolimus",
                "Ado-Trastuzumab Emtansine",
                "Neratinib Maleate",
                "Capivasertib",
                "Alpelisib",
                "Tucatinib",
                "Sacituzumab Govitecan-hziy"
            ],
            "mismatches": [
                "Tamoxifen (Nolvadex)",
                "Raloxifene (Evista)",
                "Buparlisib",
                "Sacituzumab govitecan (Trodelvy)",
                "Enzalutamide (Xtandi)"
            ],
            "true_referents": [
                "Abemaciclib",
                "Ado-Trastuzumab Emtansine",
                "Afinitor (Everolimus)",
                "Afinitor Disperz (Everolimus)",
                "Alpelisib",
                "Anastrozole",
                "Arimidex (Anastrozole)",
                "Aromasin (Exemestane)",
                "Capivasertib",
                "Everolimus",
                "Evista (Raloxifene Hydrochloride)",
                "Exemestane",
                "Faslodex (Fulvestrant)",
                "Femara (Letrozole)",
                "Fulvestrant",
                "Herceptin (Trastuzumab)",
                "Ibrance (Palbociclib)",
                "Inavolisib",
                "Kadcyla (Ado-Trastuzumab Emtansine)",
                "Kisqali (Ribociclib Succinate)",
                "Kisqali Femara Co-Pack (Ribociclib Succinate and Letrozole)",
                "Lapatinib Ditosylate",
                "Letrozole",
                "Lynparza (Olaparib)",
                "Neratinib Maleate",
                "Nerlynx (Neratinib Maleate)",
                "Olaparib",
                "Palbociclib",
                "Pembrolizumab",
                "Perjeta (Pertuzumab)",
                "Pertuzumab",
                "Pertuzumab, Trastuzumab, and Hyaluronidase-zzxf",
                "Piqray (Alpelisib)",
                "Raloxifene Hydrochloride",
                "Ribociclib Succinate",
                "Sacituzumab Govitecan-hziy",
                "Tamoxifen Citrate",
                "Trastuzumab",
                "Trodelvy (Sacituzumab Govitecan-hziy)",
                "Truqap (Capivasertib)",
                "Tucatinib",
                "Tukysa (Tucatinib)",
                "Tykerb (Lapatinib Ditosylate)",
                "Verzenio (Abemaciclib)"
            ],
            "TP": 18,
            "FP": 5,
            "FN": 0
        }
    },
    {
        "test": "limited-list-referents-from-selection-criteria",
        "responder": "gemma-3",
        "concept": "approved drug for breast cancer",
        "domain": "medicine",
        "response": [
            "Tamoxifen (TAM)",
            "Raloxifene (RAL)",
            "Letrozole (LET)",
            "Anastrozole (ANA)",
            "Exemestane (EXE)",
            "Fulvestrant (FUL)",
            "Palbociclib (PAL)",
            "Ribociclib (RIB)",
            "Abemaciclib (ABE)",
            "Trastuzumab (HER)",
            "Pertuzumab (PER)",
            "Ado-trastuzumab emtansine (T-DM1)",
            "Sacituzumab govitecan (SG)",
            "Olaparib (OLA)",
            "Talazoparib (TAL)",
            "Capecitabine (CAP)",
            "Cyclophosphamide (CYC)",
            "Doxorubicin (DOX)",
            "Paclitaxel (PAC)",
            "Docetaxel (DOC)",
            "Vinorelbine (VIN)",
            "5-Fluorouracil (5-FU)",
            "Gemcitabine (GEM)",
            "Tucatinib (TUC)"
        ],
        "scorer": "gpt-4o",
        "judgement": {
            "matches": [
                "Tamoxifen (TAM)",
                "Raloxifene (RAL)",
                "Letrozole (LET)",
                "Anastrozole (ANA)",
                "Exemestane (EXE)",
                "Fulvestrant (FUL)",
                "Palbociclib (PAL)",
                "Ribociclib (RIB)",
                "Abemaciclib (ABE)",
                "Trastuzumab (HER)",
                "Pertuzumab (PER)",
                "Ado-trastuzumab emtansine (T-DM1)",
                "Sacituzumab govitecan (SG)",
                "Olaparib (OLA)",
                "Talazoparib (TAL)",
                "Capecitabine (CAP)",
                "Cyclophosphamide (CYC)",
                "Doxorubicin (DOX)",
                "Paclitaxel (PAC)",
                "Docetaxel (DOC)",
                "5-Fluorouracil (5-FU)",
                "Gemcitabine (GEM)",
                "Tucatinib (TUC)"
            ],
            "mismatches": [
                "Vinorelbine (VIN)"
            ],
            "true_referents": [
                "5-FU (Fluorouracil Injection)",
                "Abemaciclib",
                "Ado-Trastuzumab Emtansine",
                "Anastrozole",
                "Arimidex (Anastrozole)",
                "Aromasin (Exemestane)",
                "Capecitabine",
                "Cyclophosphamide",
                "Docetaxel",
                "Doxorubicin Hydrochloride",
                "Evista (Raloxifene Hydrochloride)",
                "Exemestane",
                "Faslodex (Fulvestrant)",
                "Femara (Letrozole)",
                "Fluorouracil Injection",
                "Fulvestrant",
                "Gemcitabine Hydrochloride",
                "Gemzar (Gemcitabine Hydrochloride)",
                "Herceptin (Trastuzumab)",
                "Ibrance (Palbociclib)",
                "Kadcyla (Ado-Trastuzumab Emtansine)",
                "Letrozole",
                "Lynparza (Olaparib)",
                "Olaparib",
                "Paclitaxel",
                "Palbociclib",
                "Perjeta (Pertuzumab)",
                "Pertuzumab",
                "Pertuzumab, Trastuzumab, and Hyaluronidase-zzxf",
                "Raloxifene Hydrochloride",
                "Ribociclib Succinate",
                "Ribociclib Succinate and Letrozole",
                "Sacituzumab Govitecan-hziy",
                "Soltamox (Tamoxifen Citrate)",
                "Talazoparib Tosylate",
                "Talzenna (Talazoparib Tosylate)",
                "Tamoxifen Citrate",
                "Taxotere (Docetaxel)",
                "Trastuzumab",
                "Trodelvy (Sacituzumab Govitecan-hziy)",
                "Tucatinib",
                "Tukysa (Tucatinib)",
                "Verzenio (Abemaciclib)",
                "Vinblastine Sulfate",
                "Xeloda (Capecitabine)"
            ],
            "TP": 23,
            "FP": 1,
            "FN": 0
        }
    },
    {
        "test": "limited-list-referents-from-selection-criteria",
        "responder": "gpt-4o",
        "concept": "approved drug for breast cancer",
        "domain": "medicine",
        "response": [
            "Tamoxifen (Nolvadex)",
            "Anastrozole (Arimidex)",
            "Letrozole (Femara)",
            "Exemestane (Aromasin)",
            "Fulvestrant (Faslodex)",
            "Trastuzumab (Herceptin)",
            "Pertuzumab (Perjeta)",
            "Palbociclib (Ibrance)",
            "Ribociclib (Kisqali)",
            "Abemaciclib (Verzenio)",
            "Everolimus (Afinitor)",
            "Lapatinib (Tykerb)",
            "Neratinib (Nerlynx)",
            "Olaparib (Lynparza)",
            "Talazoparib (Talzenna)",
            "Alpelisib (Piqray)",
            "Capecitabine (Xeloda)",
            "Vinorelbine (Navelbine)",
            "Docetaxel (Taxotere)",
            "Paclitaxel (Taxol)",
            "Cyclophosphamide (Cytoxan)",
            "Doxorubicin (Adriamycin)",
            "Carboplatin",
            "Fluorouracil (5-FU)"
        ],
        "scorer": "gpt-4o",
        "judgement": {
            "matches": [
                "Anastrozole (Arimidex)",
                "Letrozole (Femara)",
                "Exemestane (Aromasin)",
                "Fulvestrant (Faslodex)",
                "Trastuzumab (Herceptin)",
                "Pertuzumab (Perjeta)",
                "Palbociclib (Ibrance)",
                "Ribociclib (Kisqali)",
                "Abemaciclib (Verzenio)",
                "Everolimus (Afinitor)",
                "Lapatinib (Tykerb)",
                "Neratinib (Nerlynx)",
                "Olaparib (Lynparza)",
                "Talazoparib (Talzenna)",
                "Alpelisib (Piqray)",
                "Capecitabine (Xeloda)",
                "Docetaxel (Taxotere)"
            ],
            "mismatches": [
                "Tamoxifen (Nolvadex)",
                "Vinorelbine (Navelbine)",
                "Paclitaxel (Taxol)",
                "Cyclophosphamide (Cytoxan)",
                "Doxorubicin (Adriamycin)",
                "Carboplatin",
                "Fluorouracil (5-FU)"
            ],
            "true_referents": [
                "5-FU (Fluorouracil Injection)",
                "Abemaciclib",
                "Ado-Trastuzumab Emtansine",
                "Afinitor (Everolimus)",
                "Afinitor Disperz (Everolimus)",
                "Alpelisib",
                "Anastrozole",
                "Arimidex (Anastrozole)",
                "Aromasin (Exemestane)",
                "Capecitabine",
                "Cyclophosphamide",
                "Docetaxel",
                "Doxorubicin Hydrochloride",
                "Everolimus",
                "Exemestane",
                "Faslodex (Fulvestrant)",
                "Femara (Letrozole)",
                "Fluorouracil Injection",
                "Fulvestrant",
                "Herceptin (Trastuzumab)",
                "Ibrance (Palbociclib)",
                "Kisqali (Ribociclib Succinate)",
                "Kisqali Femara Co-Pack (Ribociclib Succinate and Letrozole)",
                "Lapatinib Ditosylate",
                "Letrozole",
                "Lynparza (Olaparib)",
                "Neratinib Maleate",
                "Nerlynx (Neratinib Maleate)",
                "Olaparib",
                "Paclitaxel",
                "Palbociclib",
                "Perjeta (Pertuzumab)",
                "Pertuzumab",
                "Pertuzumab, Trastuzumab, and Hyaluronidase-zzxf",
                "Piqray (Alpelisib)",
                "Ribociclib Succinate",
                "Talazoparib Tosylate",
                "Talzenna (Talazoparib Tosylate)",
                "Tamoxifen Citrate",
                "Taxotere (Docetaxel)",
                "Trastuzumab",
                "Tucatinib",
                "Tykerb (Lapatinib Ditosylate)",
                "Verzenio (Abemaciclib)",
                "Vinblastine Sulfate",
                "Xeloda (Capecitabine)"
            ],
            "TP": 17,
            "FP": 7,
            "FN": 0
        }
    },
    {
        "test": "limited-list-referents-from-selection-criteria",
        "responder": "gpt-4o-mini",
        "concept": "approved drug for breast cancer",
        "domain": "medicine",
        "response": [
            "Tamoxifen (TAM)",
            "Anastrozole (ANA)",
            "Letrozole (LET)",
            "Exemestane (EXE)",
            "Trastuzumab (HER2)",
            "Pertuzumab (PER)",
            "Lapatinib (LAP)",
            "Palbociclib (PAL)",
            "Ribociclib (RIB)",
            "Abemaciclib (ABE)",
            "Fulvestrant (FUL)",
            "Capecitabine (CAP)",
            "Docetaxel (DOC)",
            "Doxorubicin (DOX)",
            "Cyclophosphamide (CYC)",
            "Tamoxifen Citrate (TAM-C)",
            "Aromasin (ARO)",
            "Zoladex (GOS)",
            "Neratinib (NER)",
            "Adjuvant Chemotherapy (AC)",
            "Everolimus (EVE)",
            "Tucatinib (TUC)",
            "Olaparib (OLA)",
            "Sacituzumab Govitecan (SG)",
            "Bicalutamide (BIC)"
        ],
        "scorer": "gpt-4o",
        "judgement": {
            "matches": [
                "Anastrozole",
                "Letrozole",
                "Exemestane",
                "Trastuzumab",
                "Pertuzumab",
                "Palbociclib",
                "Ribociclib",
                "Abemaciclib",
                "Fulvestrant",
                "Capecitabine",
                "Docetaxel",
                "Doxorubicin",
                "Cyclophosphamide",
                "Tamoxifen Citrate",
                "Aromasin",
                "Zoladex",
                "Neratinib",
                "Everolimus",
                "Tucatinib",
                "Olaparib"
            ],
            "mismatches": [
                "Tamoxifen (TAM)",
                "Lapatinib (LAP)",
                "Ribociclib (RIB)",
                "Tamoxifen Citrate (TAM-C)",
                "Adjuvant Chemotherapy (AC)",
                "Sacituzumab Govitecan (SG)",
                "Bicalutamide (BIC)"
            ],
            "true_referents": [
                "Abemaciclib",
                "Ado-Trastuzumab Emtansine",
                "Afinitor (Everolimus)",
                "Afinitor Disperz (Everolimus)",
                "Anastrozole",
                "Arimidex (Anastrozole)",
                "Aromasin (Exemestane)",
                "Capecitabine",
                "Cyclophosphamide",
                "Docetaxel",
                "Doxorubicin Hydrochloride",
                "Everolimus",
                "Exemestane",
                "Faslodex (Fulvestrant)",
                "Femara (Letrozole)",
                "Fulvestrant",
                "Herceptin (Trastuzumab)",
                "Ibrance (Palbociclib)",
                "Lapatinib Ditosylate",
                "Letrozole",
                "Lynparza (Olaparib)",
                "Neratinib Maleate",
                "Olaparib",
                "Paclitaxel",
                "Palbociclib",
                "Perjeta (Pertuzumab)",
                "Pertuzumab",
                "Pertuzumab, Trastuzumab, and Hyaluronidase-zzxf",
                "Phesgo (Pertuzumab, Trastuzumab, and Hyaluronidase-zzxf)",
                "Ribociclib Succinate",
                "Ribociclib Succinate and Letrozole",
                "Sacituzumab Govitecan-hziy",
                "Soltamox (Tamoxifen Citrate)",
                "Tamoxifen Citrate",
                "Taxotere (Docetaxel)",
                "Trastuzumab",
                "Trodelvy (Sacituzumab Govitecan-hziy)",
                "Tucatinib",
                "Tukysa (Tucatinib)",
                "Verzenio (Abemaciclib)",
                "Xeloda (Capecitabine)",
                "Zoladex (Goserelin Acetate)"
            ],
            "TP": 20,
            "FP": 7,
            "FN": 0
        }
    },
    {
        "test": "limited-list-referents-from-selection-criteria",
        "responder": "gpt-4-32k",
        "concept": "approved drug for breast cancer",
        "domain": "medicine",
        "response": [
            "Tamoxifen (Nolvadex)",
            "Fulvestrant (Faslodex)",
            "Anastrozole (Arimidex)",
            "Letrozole (Femara)",
            "Exemestane (Aromasin)",
            "Trastuzumab (Herceptin)",
            "Pertuzumab (Perjeta)",
            "Ado-trastuzumab emtansine (Kadcyla)",
            "Palbociclib (Ibrance)",
            "Ribociclib (Kisqali)",
            "Abemaciclib (Verzenio)",
            "Lapatinib (Tykerb)",
            "Neratinib (Nerlynx)",
            "Everolimus (Afinitor)",
            "Toremifene (Fareston)",
            "Raloxifene (Evista)",
            "Olaparib (Lynparza)",
            "Talazoparib (Talzenna)",
            "Capecitabine (Xeloda)",
            "Paclitaxel (Taxol)",
            "Docetaxel (Taxotere)",
            "Carboplatin (Paraplatin)",
            "Epirubicin (Ellence)",
            "Cyclophosphamide (Cytoxan)"
        ],
        "scorer": "gpt-4o",
        "judgement": {
            "matches": [
                "Fulvestrant",
                "Anastrozole",
                "Letrozole",
                "Exemestane",
                "Trastuzumab",
                "Pertuzumab",
                "Ado-Trastuzumab Emtansine",
                "Palbociclib",
                "Ribociclib Succinate",
                "Abemaciclib",
                "Lapatinib Ditosylate",
                "Neratinib Maleate",
                "Everolimus",
                "Toremifene",
                "Raloxifene Hydrochloride",
                "Olaparib",
                "Talazoparib Tosylate",
                "Capecitabine",
                "Docetaxel",
                "Epirubicin Hydrochloride",
                "Cyclophosphamide"
            ],
            "mismatches": [
                "Tamoxifen (Nolvadex)",
                "Paclitaxel (Taxol)",
                "Carboplatin (Paraplatin)",
                "Cyclophosphamide (Cytoxan)"
            ],
            "true_referents": [
                "Abemaciclib",
                "Ado-Trastuzumab Emtansine",
                "Afinitor (Everolimus)",
                "Afinitor Disperz (Everolimus)",
                "Anastrozole",
                "Arimidex (Anastrozole)",
                "Aromasin (Exemestane)",
                "Capecitabine",
                "Cyclophosphamide",
                "Docetaxel",
                "Ellence (Epirubicin Hydrochloride)",
                "Epirubicin Hydrochloride",
                "Everolimus",
                "Evista (Raloxifene Hydrochloride)",
                "Exemestane",
                "Fareston (Toremifene)",
                "Faslodex (Fulvestrant)",
                "Femara (Letrozole)",
                "Fulvestrant",
                "Herceptin (Trastuzumab)",
                "Ibrance (Palbociclib)",
                "Kadcyla (Ado-Trastuzumab Emtansine)",
                "Kisqali (Ribociclib Succinate)",
                "Kisqali Femara Co-Pack (Ribociclib Succinate and Letrozole)",
                "Lapatinib Ditosylate",
                "Letrozole",
                "Lynparza (Olaparib)",
                "Neratinib Maleate",
                "Nerlynx (Neratinib Maleate)",
                "Olaparib",
                "Paclitaxel",
                "Palbociclib",
                "Perjeta (Pertuzumab)",
                "Pertuzumab",
                "Pertuzumab, Trastuzumab, and Hyaluronidase-zzxf",
                "Raloxifene Hydrochloride",
                "Ribociclib Succinate",
                "Talazoparib Tosylate",
                "Talzenna (Talazoparib Tosylate)",
                "Tamoxifen Citrate",
                "Taxotere (Docetaxel)",
                "Toremifene",
                "Trastuzumab",
                "Tucatinib",
                "Tykerb (Lapatinib Ditosylate)",
                "Verzenio (Abemaciclib)",
                "Xeloda (Capecitabine)"
            ],
            "TP": 21,
            "FP": 4,
            "FN": 0
        }
    },
    {
        "test": "limited-list-referents-from-selection-criteria",
        "responder": "gpt-35-turbo-16k",
        "concept": "approved drug for breast cancer",
        "domain": "medicine",
        "response": [
            "Tamoxifen",
            "Letrozole",
            "Anastrozole",
            "Exemestane",
            "Fulvestrant",
            "Arimidex",
            "Aromasin",
            "Fareston",
            "Nolvadex",
            "Evista",
            "Afinitor",
            "Ibrance",
            "Kisqali",
            "Verzenio",
            "Perjeta",
            "Herceptin",
            "Tykerb",
            "Kadcyla",
            "Halaven",
            "Abraxane",
            "Xeloda",
            "Taxol",
            "Adriamycin",
            "Cytoxan"
        ],
        "scorer": "gpt-4o",
        "judgement": {
            "matches": [
                "Letrozole",
                "Anastrozole",
                "Exemestane",
                "Fulvestrant",
                "Arimidex",
                "Aromasin",
                "Fareston",
                "Evista",
                "Afinitor",
                "Ibrance",
                "Kisqali",
                "Verzenio",
                "Perjeta",
                "Herceptin",
                "Tykerb",
                "Kadcyla",
                "Halaven",
                "Abraxane",
                "Xeloda"
            ],
            "mismatches": [
                "Tamoxifen",
                "Nolvadex",
                "Taxol",
                "Adriamycin",
                "Cytoxan"
            ],
            "true_referents": [
                "Abraxane (Paclitaxel Albumin-stabilized Nanoparticle Formulation)",
                "Afinitor (Everolimus)",
                "Afinitor Disperz (Everolimus)",
                "Anastrozole",
                "Aredia (Pamidronate Disodium)",
                "Arimidex (Anastrozole)",
                "Aromasin (Exemestane)",
                "Capecitabine",
                "Cyclophosphamide",
                "Docetaxel",
                "Doxorubicin Hydrochloride",
                "Evista (Raloxifene Hydrochloride)",
                "Exemestane",
                "Fareston (Toremifene)",
                "Faslodex (Fulvestrant)",
                "Femara (Letrozole)",
                "Fulvestrant",
                "Halaven (Eribulin Mesylate)",
                "Herceptin (Trastuzumab)",
                "Ibrance (Palbociclib)",
                "Ixabepilone",
                "Kadcyla (Ado-Trastuzumab Emtansine)",
                "Kisqali (Ribociclib Succinate)",
                "Kisqali Femara Co-Pack (Ribociclib Succinate and Letrozole)",
                "Letrozole",
                "Paclitaxel",
                "Palbociclib",
                "Perjeta (Pertuzumab)",
                "Pertuzumab",
                "Piqray (Alpelisib)",
                "Soltamox (Tamoxifen Citrate)",
                "Tamoxifen Citrate",
                "Taxotere (Docetaxel)",
                "Trastuzumab",
                "Tucatinib",
                "Tykerb (Lapatinib Ditosylate)",
                "Verzenio (Abemaciclib)",
                "Xeloda (Capecitabine)"
            ],
            "TP": 19,
            "FP": 5,
            "FN": 0
        }
    },
    {
        "test": "limited-list-referents-from-selection-criteria",
        "responder": "o1-mini",
        "concept": "approved drug for breast cancer",
        "domain": "medicine",
        "response": [
            "Tamoxifen (Nolvadex)",
            "Anastrozole (Arimidex)",
            "Letrozole (Femara)",
            "Exemestane (Aromasin)",
            "Trastuzumab (Herceptin)",
            "Pertuzumab (Perjeta)",
            "Paclitaxel (Taxol)",
            "Docetaxel (Taxotere)",
            "Fulvestrant (Faslodex)",
            "Ribociclib (Kisqali)",
            "Palbociclib (Ibrance)",
            "Abemaciclib (Verzenio)",
            "Everolimus (Afinitor)",
            "Alpelisib (Piqray)",
            "Neratinib (Nerlynx)",
            "Olaparib (Lynparza)",
            "Trastuzumab emtansine (Kadcyla)",
            "Vinorelbine (Navelbine)",
            "Cyclophosphamide (Cytoxan)",
            "Methotrexate (Trexall)",
            "Carboplatin (Paraplatin)",
            "Bevacizumab (Avastin)",
            "Ixabepilone (Ixempra)",
            "Sacituzumab govitecan (Trodelvy)"
        ],
        "scorer": "gpt-4o",
        "judgement": {
            "matches": [
                "Anastrozole (Arimidex)",
                "Letrozole (Femara)",
                "Exemestane (Aromasin)",
                "Trastuzumab (Herceptin)",
                "Pertuzumab (Perjeta)",
                "Docetaxel (Taxotere)",
                "Fulvestrant (Faslodex)",
                "Ribociclib (Kisqali)",
                "Palbociclib (Ibrance)",
                "Abemaciclib (Verzenio)",
                "Everolimus (Afinitor)",
                "Alpelisib (Piqray)",
                "Neratinib (Nerlynx)",
                "Olaparib (Lynparza)",
                "Ixabepilone (Ixempra)"
            ],
            "mismatches": [
                "Tamoxifen (Nolvadex)",
                "Paclitaxel (Taxol)",
                "Trastuzumab emtansine (Kadcyla)",
                "Vinorelbine (Navelbine)",
                "Cyclophosphamide (Cytoxan)",
                "Methotrexate (Trexall)",
                "Carboplatin (Paraplatin)",
                "Bevacizumab (Avastin)",
                "Sacituzumab govitecan (Trodelvy)"
            ],
            "true_referents": [
                "Abemaciclib",
                "Ado-Trastuzumab Emtansine",
                "Afinitor (Everolimus)",
                "Afinitor Disperz (Everolimus)",
                "Alpelisib",
                "Anastrozole",
                "Arimidex (Anastrozole)",
                "Aromasin (Exemestane)",
                "Capecitabine",
                "Cyclophosphamide",
                "Docetaxel",
                "Everolimus",
                "Exemestane",
                "Faslodex (Fulvestrant)",
                "Femara (Letrozole)",
                "Fulvestrant",
                "Herceptin (Trastuzumab)",
                "Ibrance (Palbociclib)",
                "Ixabepilone",
                "Ixempra (Ixabepilone)",
                "Kadcyla (Ado-Trastuzumab Emtansine)",
                "Kisqali (Ribociclib Succinate)",
                "Kisqali Femara Co-Pack (Ribociclib Succinate and Letrozole)",
                "Letrozole",
                "Lynparza (Olaparib)",
                "Methotrexate Sodium",
                "Neratinib Maleate",
                "Nerlynx (Neratinib Maleate)",
                "Olaparib",
                "Paclitaxel",
                "Palbociclib",
                "Perjeta (Pertuzumab)",
                "Pertuzumab",
                "Pertuzumab, Trastuzumab, and Hyaluronidase-zzxf",
                "Piqray (Alpelisib)",
                "Ribociclib Succinate",
                "Sacituzumab Govitecan-hziy",
                "Tamoxifen Citrate",
                "Taxotere (Docetaxel)",
                "Trastuzumab",
                "Trodelvy (Sacituzumab Govitecan-hziy)",
                "Tucatinib",
                "Verzenio (Abemaciclib)",
                "Vinblastine Sulfate"
            ],
            "TP": 15,
            "FP": 9,
            "FN": 0
        }
    },
    {
        "test": "limited-list-referents-from-selection-criteria",
        "responder": "anthropic.claude-3-5-sonnet-v1:0",
        "concept": "approved drug for breast cancer",
        "domain": "medicine",
        "response": [
            "Tamoxifen (TAM)",
            "Anastrozole (ANA)",
            "Letrozole (LET)",
            "Exemestane (EXE)",
            "Fulvestrant (FUL)",
            "Raloxifene (RAL)",
            "Goserelin (GOS)",
            "Leuprolide (LEU)",
            "Triptorelin (TRI)",
            "Palbociclib (PAL)",
            "Ribociclib (RIB)",
            "Abemaciclib (ABE)",
            "Olaparib (OLA)",
            "Talazoparib (TAL)",
            "Neratinib (NER)",
            "Pertuzumab (PER)",
            "Trastuzumab (TRA)",
            "Ado-trastuzumab emtansine (T-DM1)",
            "Lapatinib (LAP)",
            "Everolimus (EVE)",
            "Alpelisib (ALP)",
            "Tucatinib (TUC)",
            "Sacituzumab govitecan (SAC)",
            "Fam-trastuzumab deruxtecan-nxki (T-DXd)"
        ],
        "scorer": "gpt-4o",
        "judgement": {
            "matches": [
                "Anastrozole",
                "Letrozole",
                "Exemestane",
                "Fulvestrant",
                "Raloxifene Hydrochloride",
                "Goserelin Acetate",
                "Palbociclib",
                "Ribociclib Succinate",
                "Abemaciclib",
                "Olaparib",
                "Talazoparib Tosylate",
                "Neratinib Maleate",
                "Pertuzumab",
                "Trastuzumab",
                "Ado-Trastuzumab Emtansine",
                "Lapatinib Ditosylate",
                "Everolimus",
                "Alpelisib",
                "Tucatinib",
                "Sacituzumab Govitecan-hziy",
                "Fam-Trastuzumab Deruxtecan-nxki"
            ],
            "mismatches": [
                "Tamoxifen (TAM)",
                "Leuprolide (LEU)",
                "Triptorelin (TRI)"
            ],
            "true_referents": [
                "Abemaciclib",
                "Ado-Trastuzumab Emtansine",
                "Afinitor (Everolimus)",
                "Afinitor Disperz (Everolimus)",
                "Alpelisib",
                "Anastrozole",
                "Arimidex (Anastrozole)",
                "Aromasin (Exemestane)",
                "Enhertu (Fam-Trastuzumab Deruxtecan-nxki)",
                "Everolimus",
                "Evista (Raloxifene Hydrochloride)",
                "Exemestane",
                "Fam-Trastuzumab Deruxtecan-nxki",
                "Faslodex (Fulvestrant)",
                "Femara (Letrozole)",
                "Fulvestrant",
                "Goserelin Acetate",
                "Herceptin (Trastuzumab)",
                "Ibrance (Palbociclib)",
                "Ixempra (Ixabepilone)",
                "Kadcyla (Ado-Trastuzumab Emtansine)",
                "Lapatinib Ditosylate",
                "Letrozole",
                "Lynparza (Olaparib)",
                "Neratinib Maleate",
                "Olaparib",
                "Palbociclib",
                "Perjeta (Pertuzumab)",
                "Pertuzumab",
                "Pertuzumab, Trastuzumab, and Hyaluronidase-zzxf",
                "Piqray (Alpelisib)",
                "Raloxifene Hydrochloride",
                "Ribociclib Succinate",
                "Ribociclib Succinate and Letrozole",
                "Sacituzumab Govitecan-hziy",
                "Soltamox (Tamoxifen Citrate)",
                "Talazoparib Tosylate",
                "Talzenna (Talazoparib Tosylate)",
                "Tamoxifen Citrate",
                "Taxotere (Docetaxel)",
                "Trastuzumab",
                "Trodelvy (Sacituzumab Govitecan-hziy)",
                "Tucatinib",
                "Tukysa (Tucatinib)",
                "Verzenio (Abemaciclib)",
                "Zoladex (Goserelin Acetate)"
            ],
            "TP": 21,
            "FP": 3,
            "FN": 0
        }
    },
    {
        "test": "limited-list-referents-from-selection-criteria",
        "responder": "anthropic.claude-3-opus-v1:0",
        "concept": "approved drug for breast cancer",
        "domain": "medicine",
        "response": [
            "Tamoxifen",
            "Raloxifene",
            "Anastrozole (Arimidex)",
            "Exemestane (Aromasin)",
            "Letrozole (Femara)",
            "Fulvestrant (Faslodex)",
            "Everolimus (Afinitor)",
            "Palbociclib (Ibrance)",
            "Ribociclib (Kisqali)",
            "Abemaciclib (Verzenio)",
            "Trastuzumab (Herceptin)",
            "Pertuzumab (Perjeta)",
            "Ado-trastuzumab emtansine (Kadcyla)",
            "Lapatinib (Tykerb)",
            "Neratinib (Nerlynx)",
            "Olaparib (Lynparza)",
            "Talazoparib (Talzenna)",
            "Alpelisib (Piqray)",
            "Tucatinib (Tukysa)",
            "Margetuximab (Margenza)",
            "Sacituzumab govitecan (Trodelvy)",
            "Fam-trastuzumab deruxtecan (Enhertu)",
            "Capecitabine (Xeloda)",
            "Paclitaxel"
        ],
        "scorer": "gpt-4o",
        "judgement": {
            "matches": [
                "Anastrozole (Arimidex)",
                "Exemestane (Aromasin)",
                "Letrozole (Femara)",
                "Fulvestrant (Faslodex)",
                "Everolimus (Afinitor)",
                "Palbociclib (Ibrance)",
                "Ribociclib (Kisqali)",
                "Abemaciclib (Verzenio)",
                "Trastuzumab (Herceptin)",
                "Pertuzumab (Perjeta)",
                "Ado-trastuzumab emtansine (Kadcyla)",
                "Lapatinib (Tykerb)",
                "Neratinib (Nerlynx)",
                "Olaparib (Lynparza)",
                "Talazoparib (Talzenna)",
                "Alpelisib (Piqray)",
                "Tucatinib (Tukysa)",
                "Margetuximab (Margenza)",
                "Sacituzumab govitecan (Trodelvy)",
                "Fam-trastuzumab deruxtecan (Enhertu)",
                "Capecitabine (Xeloda)",
                "Paclitaxel"
            ],
            "mismatches": [
                "Tamoxifen",
                "Raloxifene"
            ],
            "true_referents": [
                "Abemaciclib",
                "Ado-Trastuzumab Emtansine",
                "Afinitor (Everolimus)",
                "Afinitor Disperz (Everolimus)",
                "Alpelisib",
                "Anastrozole",
                "Arimidex (Anastrozole)",
                "Aromasin (Exemestane)",
                "Capecitabine",
                "Docetaxel",
                "Enhertu (Fam-Trastuzumab Deruxtecan-nxki)",
                "Everolimus",
                "Evista (Raloxifene Hydrochloride)",
                "Exemestane",
                "Fam-Trastuzumab Deruxtecan-nxki",
                "Faslodex (Fulvestrant)",
                "Femara (Letrozole)",
                "Fulvestrant",
                "Herceptin (Trastuzumab)",
                "Ibrance (Palbociclib)",
                "Kadcyla (Ado-Trastuzumab Emtansine)",
                "Kisqali (Ribociclib Succinate)",
                "Kisqali Femara Co-Pack (Ribociclib Succinate and Letrozole)",
                "Lapatinib Ditosylate",
                "Letrozole",
                "Lynparza (Olaparib)",
                "Margenza (Margetuximab-cmkb)",
                "Margetuximab-cmkb",
                "Neratinib Maleate",
                "Nerlynx (Neratinib Maleate)",
                "Olaparib",
                "Paclitaxel",
                "Palbociclib",
                "Perjeta (Pertuzumab)",
                "Pertuzumab",
                "Pertuzumab, Trastuzumab, and Hyaluronidase-zzxf",
                "Piqray (Alpelisib)",
                "Raloxifene Hydrochloride",
                "Ribociclib Succinate",
                "Sacituzumab Govitecan-hziy",
                "Soltamox (Tamoxifen Citrate)",
                "Talazoparib Tosylate",
                "Talzenna (Talazoparib Tosylate)",
                "Tamoxifen Citrate",
                "Taxotere (Docetaxel)",
                "Trastuzumab",
                "Trodelvy (Sacituzumab Govitecan-hziy)",
                "Tucatinib",
                "Tukysa (Tucatinib)",
                "Tykerb (Lapatinib Ditosylate)",
                "Verzenio (Abemaciclib)",
                "Xeloda (Capecitabine)"
            ],
            "TP": 22,
            "FP": 2,
            "FN": 0
        }
    },
    {
        "test": "limited-list-referents-from-selection-criteria",
        "responder": "anthropic.claude-3-sonnet-v1:0",
        "concept": "approved drug for breast cancer",
        "domain": "medicine",
        "response": [
            "tamoxifen (TAM)",
            "raloxifene (RAL)",
            "anastrozole (ANA)",
            "exemestane (EXE)",
            "letrozole (LET)",
            "palbociclib (PAL)",
            "ribociclib (RIB)",
            "abemaciclib (ABE)",
            "everolimus (EVE)",
            "alpelisib (ALP)",
            "trastuzumab (TRA)",
            "pertuzumab (PER)",
            "lapatinib (LAP)",
            "neratinib (NER)",
            "tucatinib (TUC)",
            "olaparib (OLA)",
            "talazoparib (TAL)",
            "goserelin (GOS)",
            "leuprolide (LEU)",
            "fulvestrant (FUL)",
            "capecitabine (CAP)",
            "gemcitabine (GEM)",
            "doxorubicin (DOX)",
            "paclitaxel (PAC)"
        ],
        "scorer": "gpt-4o",
        "judgement": {
            "matches": [
                "Anastrozole",
                "Exemestane",
                "Letrozole",
                "Palbociclib",
                "Ribociclib Succinate",
                "Abemaciclib",
                "Everolimus",
                "Alpelisib",
                "Trastuzumab",
                "Pertuzumab",
                "Lapatinib Ditosylate",
                "Neratinib Maleate",
                "Tucatinib",
                "Olaparib",
                "Talazoparib Tosylate",
                "Goserelin Acetate",
                "Fulvestrant",
                "Capecitabine",
                "Gemcitabine Hydrochloride",
                "Doxorubicin Hydrochloride",
                "Paclitaxel"
            ],
            "mismatches": [
                "Tamoxifen (TAM)",
                "Raloxifene (RAL)",
                "Leuprolide (LEU)"
            ],
            "true_referents": [
                "Abemaciclib",
                "Ado-Trastuzumab Emtansine",
                "Afinitor (Everolimus)",
                "Afinitor Disperz (Everolimus)",
                "Alpelisib",
                "Anastrozole",
                "Arimidex (Anastrozole)",
                "Aromasin (Exemestane)",
                "Capecitabine",
                "Docetaxel",
                "Doxorubicin Hydrochloride",
                "Everolimus",
                "Evista (Raloxifene Hydrochloride)",
                "Exemestane",
                "Faslodex (Fulvestrant)",
                "Femara (Letrozole)",
                "Fulvestrant",
                "Gemcitabine Hydrochloride",
                "Gemzar (Gemcitabine Hydrochloride)",
                "Goserelin Acetate",
                "Herceptin (Trastuzumab)",
                "Ibrance (Palbociclib)",
                "Lapatinib Ditosylate",
                "Letrozole",
                "Lynparza (Olaparib)",
                "Neratinib Maleate",
                "Olaparib",
                "Paclitaxel",
                "Palbociclib",
                "Perjeta (Pertuzumab)",
                "Pertuzumab",
                "Pertuzumab, Trastuzumab, and Hyaluronidase-zzxf",
                "Piqray (Alpelisib)",
                "Raloxifene Hydrochloride",
                "Ribociclib Succinate",
                "Ribociclib Succinate and Letrozole",
                "Soltamox (Tamoxifen Citrate)",
                "Talazoparib Tosylate",
                "Talzenna (Talazoparib Tosylate)",
                "Tamoxifen Citrate",
                "Taxotere (Docetaxel)",
                "Trastuzumab",
                "Tucatinib",
                "Tukysa (Tucatinib)",
                "Verzenio (Abemaciclib)",
                "Xeloda (Capecitabine)",
                "Zoladex (Goserelin Acetate)"
            ],
            "TP": 21,
            "FP": 3,
            "FN": 0
        }
    },
    {
        "test": "limited-list-referents-from-selection-criteria",
        "responder": "anthropic.claude-3-haiku-v1:0",
        "concept": "approved drug for breast cancer",
        "domain": "medicine",
        "response": [
            "Tamoxifen (TAM)",
            "Fulvestrant (FUL)",
            "Letrozole (LET)",
            "Anastrozole (ANA)",
            "Exemestane (EXE)",
            "Palbociclib (PAL)",
            "Ribociclib (RIB)",
            "Abemaciclib (ABE)",
            "Trastuzumab (TRA)",
            "Pertuzumab (PER)",
            "Lapatinib (LAP)",
            "Neratinib (NER)",
            "Ado-trastuzumab emtansine (T-DM1)",
            "Olaparib (OLA)",
            "Talazoparib (TAL)",
            "Alpelisib (ALP)",
            "Everolimus (EVE)",
            "Ribociclib + Letrozole (RIB+LET)",
            "Palbociclib + Letrozole (PAL+LET)",
            "Abemaciclib + Fulvestrant (ABE+FUL)",
            "Trastuzumab + Pertuzumab (TRA+PER)",
            "Trastuzumab + Emtansine (T-DM1)",
            "Olaparib + Paclitaxel (OLA+PAC)",
            "Alpelisib + Fulvestrant (ALP+FUL)"
        ],
        "scorer": "gpt-4o",
        "judgement": {
            "matches": [
                "Tamoxifen (TAM)",
                "Fulvestrant (FUL)",
                "Letrozole (LET)",
                "Anastrozole (ANA)",
                "Exemestane (EXE)",
                "Palbociclib (PAL)",
                "Ribociclib (RIB)",
                "Abemaciclib (ABE)",
                "Trastuzumab (TRA)",
                "Pertuzumab (PER)",
                "Neratinib (NER)",
                "Olaparib (OLA)",
                "Talazoparib (TAL)",
                "Alpelisib (ALP)",
                "Everolimus (EVE)"
            ],
            "mismatches": [
                "Lapatinib (LAP)",
                "Ado-trastuzumab emtansine (T-DM1)",
                "Ribociclib + Letrozole (RIB+LET)",
                "Palbociclib + Letrozole (PAL+LET)",
                "Abemaciclib + Fulvestrant (ABE+FUL)",
                "Trastuzumab + Pertuzumab (TRA+PER)",
                "Trastuzumab + Emtansine (T-DM1)",
                "Olaparib + Paclitaxel (OLA+PAC)",
                "Alpelisib + Fulvestrant (ALP+FUL)"
            ],
            "true_referents": [
                "Abemaciclib",
                "Ado-Trastuzumab Emtansine",
                "Afinitor (Everolimus)",
                "Afinitor Disperz (Everolimus)",
                "Alpelisib",
                "Anastrozole",
                "Arimidex (Anastrozole)",
                "Aromasin (Exemestane)",
                "Everolimus",
                "Exemestane",
                "Faslodex (Fulvestrant)",
                "Femara (Letrozole)",
                "Fulvestrant",
                "Herceptin (Trastuzumab)",
                "Ibrance (Palbociclib)",
                "Kadcyla (Ado-Trastuzumab Emtansine)",
                "Kisqali Femara Co-Pack (Ribociclib Succinate and Letrozole)",
                "Lapatinib Ditosylate",
                "Letrozole",
                "Lynparza (Olaparib)",
                "Neratinib Maleate",
                "Olaparib",
                "Paclitaxel",
                "Palbociclib",
                "Perjeta (Pertuzumab)",
                "Pertuzumab",
                "Pertuzumab, Trastuzumab, and Hyaluronidase-zzxf",
                "Piqray (Alpelisib)",
                "Ribociclib Succinate",
                "Ribociclib Succinate and Letrozole",
                "Soltamox (Tamoxifen Citrate)",
                "Talazoparib Tosylate",
                "Talzenna (Talazoparib Tosylate)",
                "Tamoxifen Citrate",
                "Trastuzumab",
                "Tucatinib",
                "Verzenio (Abemaciclib)"
            ],
            "TP": 15,
            "FP": 9,
            "FN": 0
        }
    },
    {
        "test": "limited-list-referents-from-selection-criteria",
        "responder": "meta.llama3-8b-instruct-v1:0",
        "concept": "approved drug for breast cancer",
        "domain": "medicine",
        "response": [
            "Tamoxifen (Tamoxifen)",
            "Raloxifene (Raloxifene)",
            "Fulvestrant (Fulvestrant)",
            "Exemestane (Exemestane)",
            "Letrozole (Letrozole)",
            "Anastrozole (Anastrozole)",
            "Aromasin (Exemestane)",
            "Arimidex (Anastrozole)",
            "Faslodex (Fulvestrant)",
            "Evista (Raloxifene)",
            "Aromasin (Exemestane)",
            "Femara (Letrozole)",
            "Nolvadex (Tamoxifen)",
            "Soltamox (Tamoxifen)",
            "Tamoxifen Citrate (Tamoxifen)",
            "Aromasin (Exemestane)",
            "Faslodex (Fulvestrant)",
            "Arimidex (Anastrozole)",
            "Evista (Raloxifene)",
            "Femara (Letrozole)",
            "Nolvadex (Tamoxifen)",
            "Soltamox (Tamoxifen)",
            "Tamoxifen Citrate (Tamoxifen)",
            "Fulvestrant (Fulvestrant)",
            "Exemestane (Exemestane)",
            "Letrozole (Letrozole)",
            "Anastrozole (Anastrozole)"
        ],
        "scorer": "gpt-4o",
        "judgement": {
            "matches": [
                "Aromasin (Exemestane)",
                "Arimidex (Anastrozole)",
                "Faslodex (Fulvestrant)",
                "Evista (Raloxifene)",
                "Femara (Letrozole)",
                "Soltamox (Tamoxifen)",
                "Tamoxifen Citrate (Tamoxifen)",
                "Fulvestrant (Fulvestrant)",
                "Exemestane (Exemestane)",
                "Letrozole (Letrozole)",
                "Anastrozole (Anastrozole)"
            ],
            "mismatches": [
                "Tamoxifen (Tamoxifen)",
                "Raloxifene (Raloxifene)",
                "Nolvadex (Tamoxifen)"
            ],
            "true_referents": [
                "Anastrozole",
                "Arimidex (Anastrozole)",
                "Aromasin (Exemestane)",
                "Evista (Raloxifene Hydrochloride)",
                "Exemestane",
                "Faslodex (Fulvestrant)",
                "Femara (Letrozole)",
                "Fulvestrant",
                "Letrozole",
                "Raloxifene Hydrochloride",
                "Soltamox (Tamoxifen Citrate)",
                "Tamoxifen Citrate"
            ],
            "TP": 11,
            "FP": 3,
            "FN": 0
        }
    },
    {
        "test": "limited-list-referents-from-selection-criteria",
        "responder": "meta.llama3-70b-instruct-v1:0",
        "concept": "approved drug for breast cancer",
        "domain": "medicine",
        "response": [
            "Tamoxifen (Soltamox)",
            "Raloxifene (Evista)",
            "Toremifene (Fareston)",
            "Anastrozole (Arimidex)",
            "Letrozole (Femara)",
            "Exemestane (Aromasin)",
            "Fulvestrant (Faslodex)",
            "Abemaciclib (Verzenio)",
            "Palbociclib (Ibrance)",
            "Ribociclib (Kisqali)",
            "Everolimus (Afinitor)",
            "Trastuzumab (Herceptin)",
            "Pertuzumab (Perjeta)",
            "Ado-trastuzumab emtansine (Kadcyla)",
            "Neratinib (Nerlynx)",
            "Lapatinib (Tykerb)",
            "Capecitabine (Xeloda)",
            "Docetaxel (Taxotere)",
            "Paclitaxel (Taxol)",
            "Eribulin (Halaven)",
            "Vinorelbine (Navelbine)",
            "Cyclophosphamide (Cytoxan)",
            "Doxorubicin (Adriamycin)"
        ],
        "scorer": "gpt-4o",
        "judgement": {
            "matches": [
                "Anastrozole (Arimidex)",
                "Letrozole (Femara)",
                "Exemestane (Aromasin)",
                "Fulvestrant (Faslodex)",
                "Abemaciclib (Verzenio)",
                "Palbociclib (Ibrance)",
                "Ribociclib (Kisqali)",
                "Everolimus (Afinitor)",
                "Trastuzumab (Herceptin)",
                "Pertuzumab (Perjeta)",
                "Ado-trastuzumab emtansine (Kadcyla)",
                "Neratinib (Nerlynx)",
                "Lapatinib (Tykerb)",
                "Capecitabine (Xeloda)",
                "Docetaxel (Taxotere)"
            ],
            "mismatches": [
                "Tamoxifen (Soltamox)",
                "Raloxifene (Evista)",
                "Toremifene (Fareston)",
                "Paclitaxel (Taxol)",
                "Eribulin (Halaven)",
                "Vinorelbine (Navelbine)",
                "Cyclophosphamide (Cytoxan)",
                "Doxorubicin (Adriamycin)"
            ],
            "true_referents": [
                "Abemaciclib",
                "Ado-Trastuzumab Emtansine",
                "Afinitor (Everolimus)",
                "Afinitor Disperz (Everolimus)",
                "Anastrozole",
                "Arimidex (Anastrozole)",
                "Aromasin (Exemestane)",
                "Capecitabine",
                "Cyclophosphamide",
                "Docetaxel",
                "Doxorubicin Hydrochloride",
                "Eribulin Mesylate",
                "Everolimus",
                "Evista (Raloxifene Hydrochloride)",
                "Exemestane",
                "Fareston (Toremifene)",
                "Faslodex (Fulvestrant)",
                "Femara (Letrozole)",
                "Fulvestrant",
                "Halaven (Eribulin Mesylate)",
                "Herceptin (Trastuzumab)",
                "Ibrance (Palbociclib)",
                "Kadcyla (Ado-Trastuzumab Emtansine)",
                "Kisqali (Ribociclib Succinate)",
                "Kisqali Femara Co-Pack (Ribociclib Succinate and Letrozole)",
                "Lapatinib Ditosylate",
                "Letrozole",
                "Neratinib Maleate",
                "Nerlynx (Neratinib Maleate)",
                "Paclitaxel",
                "Palbociclib",
                "Perjeta (Pertuzumab)",
                "Pertuzumab",
                "Pertuzumab, Trastuzumab, and Hyaluronidase-zzxf",
                "Raloxifene Hydrochloride",
                "Ribociclib Succinate",
                "Soltamox (Tamoxifen Citrate)",
                "Tamoxifen Citrate",
                "Taxotere (Docetaxel)",
                "Toremifene",
                "Trastuzumab",
                "Tucatinib",
                "Tykerb (Lapatinib Ditosylate)",
                "Verzenio (Abemaciclib)",
                "Vinblastine Sulfate",
                "Xeloda (Capecitabine)"
            ],
            "TP": 15,
            "FP": 8,
            "FN": 0
        }
    },
    {
        "test": "limited-list-referents-from-selection-criteria",
        "responder": "amazon.titan-text-express-v1",
        "concept": "approved drug for breast cancer",
        "domain": "medicine",
        "response": [
            {
                "referent": "tamoxifen",
                "canonical name": "tamoxifen"
            },
            {
                "referent": "exemestane",
                "canonical name": "exemestane"
            },
            {
                "referent": "letrozole",
                "canonical name": "letrozole"
            },
            {
                "referent": "anastrozole",
                "canonical name": "anastrozole"
            },
            {
                "referent": "fulvestrant",
                "canonical name": "fulvestrant"
            }
        ],
        "scorer": "gpt-4o",
        "judgement": {
            "matches": [
                "exemestane",
                "letrozole",
                "anastrozole",
                "fulvestrant"
            ],
            "mismatches": [
                "tamoxifen"
            ],
            "true_referents": [
                "Anastrozole",
                "Arimidex (Anastrozole)",
                "Aromasin (Exemestane)",
                "Exemestane",
                "Faslodex (Fulvestrant)",
                "Femara (Letrozole)",
                "Fulvestrant",
                "Letrozole",
                "Soltamox (Tamoxifen Citrate)",
                "Tamoxifen Citrate"
            ],
            "TP": 4,
            "FP": 1,
            "FN": 0
        }
    }
]