[
    {
        "test": "limited-list-referents",
        "responder": "qwen-v2.5-14b-instruct",
        "concept": "approved drug for prostate cancer",
        "domain": "medicine",
        "response": [
            "Abiraterone acetate (Zytiga)",
            "Enzalutamide (Xtandi)",
            "Docetaxel (Taxotere)",
            "Cabazitaxel (Jevtana)",
            "Bicalutamide (Casodex)",
            "Nilutamide (Nilandron)",
            "Flutamide",
            "Lutetium-177 PSMA-617 (Lu-PSMA Therapy)",
            "Radium-223 dichloride (Xofigo)",
            "Doxorubicin (Adriamycin)",
            "Mitoxantrone (Novantrone)",
            "Prednisone",
            "Estramustine (Emcyt)",
            "Sipuleucel-T (Provenge)",
            "Aflibercept (Zaltrap)",
            "Olaparib (Lynparza)",
            "Darolutamide (Nubeqa)",
            "Talazoparib (Talzenna)",
            "Rucaparib (Rubraca)",
            "Vedotin (Kadcyla)",
            "Ipilimumab (Yervoy)",
            "Nivolumab (Opdivo)",
            "Pembrolizumab (Keytruda)",
            "Dalantercept (ANG1002)"
        ],
        "scorer": "gpt-4o",
        "judgement": {
            "matches": [
                "Abiraterone acetate (Zytiga)",
                "Enzalutamide (Xtandi)",
                "Docetaxel (Taxotere)",
                "Cabazitaxel (Jevtana)",
                "Bicalutamide (Casodex)",
                "Nilutamide (Nilandron)",
                "Flutamide",
                "Lutetium-177 PSMA-617 (Lu-PSMA Therapy)",
                "Radium-223 dichloride (Xofigo)",
                "Doxorubicin (Adriamycin)",
                "Mitoxantrone (Novantrone)",
                "Prednisone",
                "Estramustine (Emcyt)",
                "Sipuleucel-T (Provenge)",
                "Aflibercept (Zaltrap)",
                "Olaparib (Lynparza)",
                "Darolutamide (Nubeqa)",
                "Talazoparib (Talzenna)",
                "Rucaparib (Rubraca)",
                "Vedotin (Kadcyla)",
                "Ipilimumab (Yervoy)",
                "Nivolumab (Opdivo)",
                "Pembrolizumab (Keytruda)",
                "Dalantercept (ANG1002)"
            ],
            "mismatches": [],
            "true_referents": [
                "Abiraterone acetate (Zytiga)",
                "Aflibercept (Zaltrap)",
                "Bicalutamide (Casodex)",
                "Cabazitaxel (Jevtana)",
                "Dalantercept (ANG1002)",
                "Darolutamide (Nubeqa)",
                "Docetaxel (Taxotere)",
                "Doxorubicin (Adriamycin)",
                "Enzalutamide (Xtandi)",
                "Estramustine (Emcyt)",
                "Flutamide",
                "Ipilimumab (Yervoy)",
                "Lutetium-177 PSMA-617 (Lu-PSMA Therapy)",
                "Mitoxantrone (Novantrone)",
                "Nilutamide (Nilandron)",
                "Nivolumab (Opdivo)",
                "Olaparib (Lynparza)",
                "Pembrolizumab (Keytruda)",
                "Prednisone",
                "Radium-223 dichloride (Xofigo)",
                "Rucaparib (Rubraca)",
                "Sipuleucel-T (Provenge)",
                "Talazoparib (Talzenna)",
                "Vedotin (Kadcyla)"
            ],
            "TP": 24,
            "FP": 0,
            "FN": 0
        }
    },
    {
        "test": "limited-list-referents",
        "responder": "phi-v4",
        "concept": "approved drug for prostate cancer",
        "domain": "medicine",
        "response": [
            "Docetaxel (DOC)",
            "Abiraterone acetate (ABI)",
            "Enzalutamide (ENZ)",
            "Apalutamide (APA)",
            "Darolutamide (DAR)",
            "Leuprolide acetate (LEU)",
            "Goserelin acetate (GOS)",
            "Triptorelin pamoate (TRI)",
            "Degarelix acetate (DEG)",
            "Flutamide (FLU)",
            "Bicalutamide (BIC)",
            "Nilutamide (NIL)",
            "Cabazitaxel (CBZ)",
            "Radium-223 dichloride (Ra-223)",
            "Sipuleucel-T (SIP)",
            "Pegylated liposomal doxorubicin (PLD)",
            "Mitoxantrone (MIT)",
            "Prednisone (PRED)",
            "Prednisolone (PRED-S)",
            "Dexamethasone (DEX)",
            "Corticosteroids (CORT)",
            "Bortezomib (BOR)",
            "Pomalidomide (POM)",
            "Carboplatin (CBDCA)"
        ],
        "scorer": "gpt-4o",
        "judgement": {
            "matches": [
                "Docetaxel (DOC)",
                "Abiraterone acetate (ABI)",
                "Enzalutamide (ENZ)",
                "Apalutamide (APA)",
                "Darolutamide (DAR)",
                "Leuprolide acetate (LEU)",
                "Goserelin acetate (GOS)",
                "Triptorelin pamoate (TRI)",
                "Degarelix acetate (DEG)",
                "Flutamide (FLU)",
                "Bicalutamide (BIC)",
                "Nilutamide (NIL)",
                "Cabazitaxel (CBZ)",
                "Radium-223 dichloride (Ra-223)",
                "Sipuleucel-T (SIP)",
                "Pegylated liposomal doxorubicin (PLD)",
                "Mitoxantrone (MIT)",
                "Prednisone (PRED)",
                "Prednisolone (PRED-S)",
                "Dexamethasone (DEX)",
                "Corticosteroids (CORT)",
                "Bortezomib (BOR)",
                "Pomalidomide (POM)",
                "Carboplatin (CBDCA)"
            ],
            "mismatches": [],
            "true_referents": [
                "Abiraterone acetate (ABI)",
                "Apalutamide (APA)",
                "Bicalutamide (BIC)",
                "Bortezomib (BOR)",
                "Cabazitaxel (CBZ)",
                "Carboplatin (CBDCA)",
                "Corticosteroids (CORT)",
                "Darolutamide (DAR)",
                "Degarelix acetate (DEG)",
                "Dexamethasone (DEX)",
                "Docetaxel (DOC)",
                "Enzalutamide (ENZ)",
                "Flutamide (FLU)",
                "Goserelin acetate (GOS)",
                "Leuprolide acetate (LEU)",
                "Mitoxantrone (MIT)",
                "Nilutamide (NIL)",
                "Pegylated liposomal doxorubicin (PLD)",
                "Pomalidomide (POM)",
                "Prednisolone (PRED-S)",
                "Prednisone (PRED)",
                "Radium-223 dichloride (Ra-223)",
                "Sipuleucel-T (SIP)",
                "Triptorelin pamoate (TRI)"
            ],
            "TP": 24,
            "FP": 0,
            "FN": 0
        }
    },
    {
        "test": "limited-list-referents",
        "responder": "mistral-small-instruct-24B",
        "concept": "approved drug for prostate cancer",
        "domain": "medicine",
        "response": [
            "Abiraterone (Zytiga)",
            "Apalutamide (Erleada)",
            "Bicalutamide (Casodex)",
            "Cabazitaxel (Jevtana)",
            "Darolutamide (Nubeqa)",
            "Degarelix (Firmagon)",
            "Docetaxel",
            "Enzalutamide (Xtandi)",
            "Estramustine",
            "Flutamide",
            "Goserelin (Zoladex)",
            "Leuprolide (Lupron)",
            "Mitoxantrone",
            "Nilutamide (Nilandron)",
            "Olaparib (Lynparza)",
            "Orteronel",
            "Prednisone",
            "Radium-223 dichloride (Xofigo)",
            "Sipuleucel-T (Provenge)",
            "Temozolomide",
            "Triptorelin (Trelstar)",
            "Bicalutamide",
            "Degarelix",
            "Goserelin",
            "Leuprolide"
        ],
        "scorer": "gpt-4o",
        "judgement": {
            "matches": [
                "Abiraterone (Zytiga)",
                "Apalutamide (Erleada)",
                "Bicalutamide (Casodex)",
                "Cabazitaxel (Jevtana)",
                "Darolutamide (Nubeqa)",
                "Degarelix (Firmagon)",
                "Docetaxel",
                "Enzalutamide (Xtandi)",
                "Estramustine",
                "Flutamide",
                "Goserelin (Zoladex)",
                "Leuprolide (Lupron)",
                "Mitoxantrone",
                "Nilutamide (Nilandron)",
                "Olaparib (Lynparza)",
                "Orteronel",
                "Prednisone",
                "Radium-223 dichloride (Xofigo)",
                "Sipuleucel-T (Provenge)",
                "Temozolomide",
                "Triptorelin (Trelstar)",
                "Bicalutamide",
                "Degarelix",
                "Goserelin",
                "Leuprolide"
            ],
            "mismatches": [],
            "true_referents": [
                "Abiraterone (Zytiga)",
                "Apalutamide (Erleada)",
                "Bicalutamide",
                "Bicalutamide (Casodex)",
                "Cabazitaxel (Jevtana)",
                "Darolutamide (Nubeqa)",
                "Degarelix",
                "Degarelix (Firmagon)",
                "Docetaxel",
                "Enzalutamide (Xtandi)",
                "Estramustine",
                "Flutamide",
                "Goserelin",
                "Goserelin (Zoladex)",
                "Leuprolide (Lupron)",
                "Mitoxantrone",
                "Nilutamide (Nilandron)",
                "Olaparib (Lynparza)",
                "Orteronel",
                "Prednisone",
                "Radium-223 dichloride (Xofigo)",
                "Sipuleucel-T (Provenge)",
                "Temozolomide",
                "Triptorelin (Trelstar)"
            ],
            "TP": 25,
            "FP": 0,
            "FN": 0
        }
    },
    {
        "test": "limited-list-referents",
        "responder": "gemma-3",
        "concept": "approved drug for prostate cancer",
        "domain": "medicine",
        "response": [
            "Leuprolide Acetate (Leu)",
            "Goserelin Acetate (Zoladex)",
            "Triptorelin Pamoate (Trelstar)",
            "Bicalutamide (Casodex)",
            "Flutamide (Eulexin)",
            "Nilutamide (Androcur)",
            "Enzalutamide (Xtandi)",
            "Apicalutamide (Erleada)",
            "Darolutamide (Nubeqa)",
            "Finasteride (Proscar)",
            "Docetaxel (Taxotere)",
            "Cabazitaxel (Jevtana)",
            "Estramustine Phosphate Sodium (Emcyt)",
            "Abiraterone Acetate (Zytiga)",
            "Radium-223 Dichloride (Xofigo)",
            "Denosumab (Prolia - off-label use)",
            "Ipilimumab (Yervoy - combination therapy)",
            "Sipuleucel-T (Provenge)",
            "Lutetium Lu 177 PSMA (Pluvicto)",
            "Olaparib (Lynparza - specific mutations)",
            "Rucaparib (Rubraca - specific mutations)",
            "Talazoparib (Talzenna - specific mutations)",
            "Pembrolizumab (Keytruda - specific mutations)",
            "Mitoxantrone (Novantrone)"
        ],
        "scorer": "gpt-4o",
        "judgement": {
            "matches": [
                "Leuprolide Acetate (Leu)",
                "Goserelin Acetate (Zoladex)",
                "Triptorelin Pamoate (Trelstar)",
                "Bicalutamide (Casodex)",
                "Flutamide (Eulexin)",
                "Nilutamide (Androcur)",
                "Enzalutamide (Xtandi)",
                "Apicalutamide (Erleada)",
                "Darolutamide (Nubeqa)",
                "Finasteride (Proscar)",
                "Docetaxel (Taxotere)",
                "Cabazitaxel (Jevtana)",
                "Estramustine Phosphate Sodium (Emcyt)",
                "Abiraterone Acetate (Zytiga)",
                "Radium-223 Dichloride (Xofigo)",
                "Denosumab (Prolia - off-label use)",
                "Ipilimumab (Yervoy - combination therapy)",
                "Sipuleucel-T (Provenge)",
                "Lutetium Lu 177 PSMA (Pluvicto)",
                "Olaparib (Lynparza - specific mutations)",
                "Rucaparib (Rubraca - specific mutations)",
                "Talazoparib (Talzenna - specific mutations)",
                "Pembrolizumab (Keytruda - specific mutations)",
                "Mitoxantrone (Novantrone)"
            ],
            "mismatches": [],
            "true_referents": [
                "Abiraterone Acetate (Zytiga)",
                "Apicalutamide (Erleada)",
                "Bicalutamide (Casodex)",
                "Cabazitaxel (Jevtana)",
                "Darolutamide (Nubeqa)",
                "Denosumab (Prolia - off-label use)",
                "Docetaxel (Taxotere)",
                "Enzalutamide (Xtandi)",
                "Estramustine Phosphate Sodium (Emcyt)",
                "Finasteride (Proscar)",
                "Flutamide (Eulexin)",
                "Goserelin Acetate (Zoladex)",
                "Ipilimumab (Yervoy - combination therapy)",
                "Leuprolide Acetate (Leu)",
                "Lutetium Lu 177 PSMA (Pluvicto)",
                "Mitoxantrone (Novantrone)",
                "Nilutamide (Androcur)",
                "Olaparib (Lynparza - specific mutations)",
                "Pembrolizumab (Keytruda - specific mutations)",
                "Radium-223 Dichloride (Xofigo)",
                "Rucaparib (Rubraca - specific mutations)",
                "Sipuleucel-T (Provenge)",
                "Talazoparib (Talzenna - specific mutations)",
                "Triptorelin Pamoate (Trelstar)"
            ],
            "TP": 24,
            "FP": 0,
            "FN": 0
        }
    },
    {
        "test": "limited-list-referents",
        "responder": "gpt-4o",
        "concept": "approved drug for prostate cancer",
        "domain": "medicine",
        "response": [
            "Abiraterone (ZYTIGA)",
            "Enzalutamide (XTANDI)",
            "Apalutamide (ERLEADA)",
            "Darolutamide (NUBEQA)",
            "Docetaxel (TAXOTERE)",
            "Cabazitaxel (JEVTANA)",
            "Sipuleucel-T (PROVENGE)",
            "Leuprolide (LUPRON DEPOT)",
            "Goserelin (ZOLADEX)",
            "Triptorelin (TRELSTAR)",
            "Degarelix (FIRMAGON)",
            "Relugolix (ORGOVYX)",
            "Bicalutamide (CASODEX)",
            "Flutamide (EULEXIN)",
            "Nilutamide (NILANDRON)",
            "Radium-223 dichloride (XOFIGO)",
            "Estramustine (EMCYT)",
            "Mitoxantrone (NOVANTRONE)",
            "Rucaparib (RUBRACA)",
            "Olaparib (LYNPARZA)",
            "Pembrolizumab (KEYTRUDA)",
            "Nivolumab (OPDIVO)",
            "Atezolizumab (TECENTRIQ)",
            "Durvalumab (IMFINZI)"
        ],
        "scorer": "gpt-4o",
        "judgement": {
            "matches": [
                "Abiraterone (ZYTIGA)",
                "Enzalutamide (XTANDI)",
                "Apalutamide (ERLEADA)",
                "Darolutamide (NUBEQA)",
                "Docetaxel (TAXOTERE)",
                "Cabazitaxel (JEVTANA)",
                "Sipuleucel-T (PROVENGE)",
                "Leuprolide (LUPRON DEPOT)",
                "Goserelin (ZOLADEX)",
                "Triptorelin (TRELSTAR)",
                "Degarelix (FIRMAGON)",
                "Relugolix (ORGOVYX)",
                "Bicalutamide (CASODEX)",
                "Flutamide (EULEXIN)",
                "Nilutamide (NILANDRON)",
                "Radium-223 dichloride (XOFIGO)",
                "Estramustine (EMCYT)",
                "Mitoxantrone (NOVANTRONE)",
                "Rucaparib (RUBRACA)",
                "Olaparib (LYNPARZA)",
                "Pembrolizumab (KEYTRUDA)",
                "Nivolumab (OPDIVO)",
                "Atezolizumab (TECENTRIQ)",
                "Durvalumab (IMFINZI)"
            ],
            "mismatches": [],
            "true_referents": [
                "Abiraterone (ZYTIGA)",
                "Apalutamide (ERLEADA)",
                "Atezolizumab (TECENTRIQ)",
                "Bicalutamide (CASODEX)",
                "Cabazitaxel (JEVTANA)",
                "Darolutamide (NUBEQA)",
                "Degarelix (FIRMAGON)",
                "Docetaxel (TAXOTERE)",
                "Durvalumab (IMFINZI)",
                "Enzalutamide (XTANDI)",
                "Estramustine (EMCYT)",
                "Flutamide (EULEXIN)",
                "Goserelin (ZOLADEX)",
                "Leuprolide (LUPRON DEPOT)",
                "Mitoxantrone (NOVANTRONE)",
                "Nilutamide (NILANDRON)",
                "Nivolumab (OPDIVO)",
                "Olaparib (LYNPARZA)",
                "Pembrolizumab (KEYTRUDA)",
                "Radium-223 dichloride (XOFIGO)",
                "Relugolix (ORGOVYX)",
                "Rucaparib (RUBRACA)",
                "Sipuleucel-T (PROVENGE)",
                "Triptorelin (TRELSTAR)"
            ],
            "TP": 24,
            "FP": 0,
            "FN": 0
        }
    },
    {
        "test": "limited-list-referents",
        "responder": "gpt-4o-mini",
        "concept": "approved drug for prostate cancer",
        "domain": "medicine",
        "response": [
            "Abiraterone (Zytiga)",
            "Enzalutamide (Xtandi)",
            "Docetaxel (Taxotere)",
            "Cabazitaxel (Jevtana)",
            "Radium-223 dichloride (Xofigo)",
            "Sipuleucel-T (Provenge)",
            "Apalutamide (Erleada)",
            "Darolutamide (Nubeqa)",
            "Lutetium Lu 177 vipivotide tetraxetan (Pluvicto)",
            "Bicalutamide (Casodex)",
            "Nilutamide (Nilandron)",
            "Flutamide (Eulexin)",
            "Ketoconazole (Nizoral)",
            "Estramustine (Emcyt)",
            "Mitoxantrone (Novantrone)",
            "Talazoparib (Talzenna)",
            "Olaparib (Lynparza)",
            "Rucaparib (Rubraca)",
            "Pembrolizumab (Keytruda)",
            "Atezolizumab (Tecentriq)",
            "Ipilimumab (Yervoy)",
            "Zolendronic acid (Zometa)",
            "Denosumab (Xgeva)",
            "Leuprolide (Lupron)",
            "Goserelin (Zoladex)"
        ],
        "scorer": "gpt-4o",
        "judgement": {
            "matches": [
                "Abiraterone (Zytiga)",
                "Apalutamide (Erleada)",
                "Atezolizumab (Tecentriq)",
                "Bicalutamide (Casodex)",
                "Cabazitaxel (Jevtana)",
                "Darolutamide (Nubeqa)",
                "Denosumab (Xgeva)",
                "Docetaxel (Taxotere)",
                "Enzalutamide (Xtandi)",
                "Estramustine (Emcyt)",
                "Flutamide (Eulexin)",
                "Ipilimumab (Yervoy)",
                "Ketoconazole (Nizoral)",
                "Leuprolide (Lupron)",
                "Lutetium Lu 177 vipivotide tetraxetan (Pluvicto)",
                "Mitoxantrone (Novantrone)",
                "Nilutamide (Nilandron)",
                "Olaparib (Lynparza)",
                "Pembrolizumab (Keytruda)",
                "Radium-223 dichloride (Xofigo)",
                "Rucaparib (Rubraca)",
                "Sipuleucel-T (Provenge)",
                "Talazoparib (Talzenna)",
                "Zolendronic acid (Zometa)"
            ],
            "mismatches": [
                "Goserelin (Zoladex)"
            ],
            "true_referents": [
                "Abiraterone (Zytiga)",
                "Apalutamide (Erleada)",
                "Atezolizumab (Tecentriq)",
                "Bicalutamide (Casodex)",
                "Cabazitaxel (Jevtana)",
                "Darolutamide (Nubeqa)",
                "Denosumab (Xgeva)",
                "Docetaxel (Taxotere)",
                "Enzalutamide (Xtandi)",
                "Estramustine (Emcyt)",
                "Flutamide (Eulexin)",
                "Ipilimumab (Yervoy)",
                "Ketoconazole (Nizoral)",
                "Leuprolide (Lupron)",
                "Lutetium Lu 177 vipivotide tetraxetan (Pluvicto)",
                "Mitoxantrone (Novantrone)",
                "Nilutamide (Nilandron)",
                "Olaparib (Lynparza)",
                "Pembrolizumab (Keytruda)",
                "Radium-223 dichloride (Xofigo)",
                "Rucaparib (Rubraca)",
                "Sipuleucel-T (Provenge)",
                "Talazoparib (Talzenna)",
                "Zolendronic acid (Zometa)"
            ],
            "TP": 24,
            "FP": 1,
            "FN": 0
        }
    },
    {
        "test": "limited-list-referents",
        "responder": "gpt-4-32k",
        "concept": "approved drug for prostate cancer",
        "domain": "medicine",
        "response": [
            "Abiraterone Acetate (Zytiga)",
            "Bicalutamide (Casodex)",
            "Cabazitaxel (Jevtana)",
            "Degarelix (Firmagon)",
            "Docetaxel (Taxotere)",
            "Dutasteride (Avodart)",
            "Enzalutamide (Xtandi)",
            "Estramustine (Emcyt)",
            "Flutamide (Eulexin)",
            "Goserelin (Zoladex)",
            "Leuprolide (Lupron)",
            "Mitoxantrone (Novantrone)",
            "Nilutamide (Nilandron)",
            "Pembrolizumab (Keytruda)",
            "Prednisone",
            "Procarbazine (Matulane)",
            "Radium-223 Dichloride (Xofigo)",
            "Sipuleucel-T (Provenge)",
            "Triptorelin (Trelstar)",
            "Finasteride (Proscar)",
            "Apalutamide (Erleada)",
            "Darolutamide (Nubeqa)",
            "Rucaparib (Rubraca)",
            "Olaparib (Lynparza)"
        ],
        "scorer": "gpt-4o",
        "judgement": {
            "matches": [
                "Abiraterone Acetate (Zytiga)",
                "Bicalutamide (Casodex)",
                "Cabazitaxel (Jevtana)",
                "Degarelix (Firmagon)",
                "Docetaxel (Taxotere)",
                "Dutasteride (Avodart)",
                "Enzalutamide (Xtandi)",
                "Estramustine (Emcyt)",
                "Flutamide (Eulexin)",
                "Goserelin (Zoladex)",
                "Leuprolide (Lupron)",
                "Mitoxantrone (Novantrone)",
                "Nilutamide (Nilandron)",
                "Pembrolizumab (Keytruda)",
                "Prednisone",
                "Procarbazine (Matulane)",
                "Radium-223 Dichloride (Xofigo)",
                "Sipuleucel-T (Provenge)",
                "Triptorelin (Trelstar)",
                "Finasteride (Proscar)",
                "Apalutamide (Erleada)",
                "Darolutamide (Nubeqa)",
                "Rucaparib (Rubraca)",
                "Olaparib (Lynparza)"
            ],
            "mismatches": [],
            "true_referents": [
                "Abiraterone Acetate (Zytiga)",
                "Apalutamide (Erleada)",
                "Bicalutamide (Casodex)",
                "Cabazitaxel (Jevtana)",
                "Darolutamide (Nubeqa)",
                "Degarelix (Firmagon)",
                "Docetaxel (Taxotere)",
                "Dutasteride (Avodart)",
                "Enzalutamide (Xtandi)",
                "Estramustine (Emcyt)",
                "Finasteride (Proscar)",
                "Flutamide (Eulexin)",
                "Goserelin (Zoladex)",
                "Leuprolide (Lupron)",
                "Mitoxantrone (Novantrone)",
                "Nilutamide (Nilandron)",
                "Olaparib (Lynparza)",
                "Pembrolizumab (Keytruda)",
                "Prednisone",
                "Procarbazine (Matulane)",
                "Radium-223 Dichloride (Xofigo)",
                "Rucaparib (Rubraca)",
                "Sipuleucel-T (Provenge)",
                "Triptorelin (Trelstar)"
            ],
            "TP": 24,
            "FP": 0,
            "FN": 0
        }
    },
    {
        "test": "limited-list-referents",
        "responder": "gpt-35-turbo-16k",
        "concept": "approved drug for prostate cancer",
        "domain": "medicine",
        "response": [
            "Leuprolide (Lupron)",
            "Bicalutamide (Casodex)",
            "Enzalutamide (Xtandi)",
            "Abiraterone (Zytiga)",
            "Degarelix (Firmagon)",
            "Apalutamide (Erleada)",
            "Radium-223 (Xofigo)",
            "Docetaxel (Taxotere)",
            "Cabazitaxel (Jevtana)",
            "Mitoxantrone (Novantrone)",
            "Pembrolizumab (Keytruda)",
            "Sipuleucel-T (Provenge)",
            "Goserelin (Zoladex)",
            "Flutamide (Eulexin)",
            "Nilutamide (Nilandron)",
            "Estramustine (Emcyt)",
            "Lutetium Lu 177 (Lutathera)",
            "Carboplatin",
            "Cisplatin",
            "Paclitaxel (Taxol)",
            "Etoposide (VP-16)",
            "Vinblastine",
            "Doxorubicin (Adriamycin)",
            "Mitomycin C"
        ],
        "scorer": "gpt-4o",
        "judgement": {
            "matches": [
                "Leuprolide (Lupron)",
                "Bicalutamide (Casodex)",
                "Enzalutamide (Xtandi)",
                "Abiraterone (Zytiga)",
                "Degarelix (Firmagon)",
                "Apalutamide (Erleada)",
                "Radium-223 (Xofigo)",
                "Docetaxel (Taxotere)",
                "Cabazitaxel (Jevtana)",
                "Mitoxantrone (Novantrone)",
                "Pembrolizumab (Keytruda)",
                "Sipuleucel-T (Provenge)",
                "Goserelin (Zoladex)",
                "Flutamide (Eulexin)",
                "Nilutamide (Nilandron)",
                "Estramustine (Emcyt)",
                "Lutetium Lu 177 (Lutathera)",
                "Carboplatin",
                "Cisplatin",
                "Paclitaxel (Taxol)",
                "Etoposide (VP-16)",
                "Vinblastine",
                "Doxorubicin (Adriamycin)",
                "Mitomycin C"
            ],
            "mismatches": [],
            "true_referents": [
                "Abiraterone (Zytiga)",
                "Apalutamide (Erleada)",
                "Bicalutamide (Casodex)",
                "Cabazitaxel (Jevtana)",
                "Carboplatin",
                "Cisplatin",
                "Degarelix (Firmagon)",
                "Docetaxel (Taxotere)",
                "Doxorubicin (Adriamycin)",
                "Enzalutamide (Xtandi)",
                "Estramustine (Emcyt)",
                "Etoposide (VP-16)",
                "Flutamide (Eulexin)",
                "Goserelin (Zoladex)",
                "Leuprolide (Lupron)",
                "Lutetium Lu 177 (Lutathera)",
                "Mitomycin C",
                "Mitoxantrone (Novantrone)",
                "Nilutamide (Nilandron)",
                "Paclitaxel (Taxol)",
                "Pembrolizumab (Keytruda)",
                "Radium-223 (Xofigo)",
                "Sipuleucel-T (Provenge)",
                "Vinblastine"
            ],
            "TP": 24,
            "FP": 0,
            "FN": 0
        }
    },
    {
        "test": "limited-list-referents",
        "responder": "o1-mini",
        "concept": "approved drug for prostate cancer",
        "domain": "medicine",
        "response": [
            "Abiraterone acetate (Zytiga)",
            "Enzalutamide (Xtandi)",
            "Apalutamide (Erleada)",
            "Darolutamide (Nubeqa)",
            "Bicalutamide (Casodex)",
            "Flutamide (Eulexin)",
            "Nilutamide (Nilandron)",
            "Docetaxel (Taxotere)",
            "Cabazitaxel (Jevtana)",
            "Mitoxantrone (Novantrone)",
            "Estramustine phosphate",
            "Leuprolide acetate (Leuplin)",
            "Goserelin acetate (Zoladex)",
            "Degarelix (Firmagon)",
            "Sipuleucel-T (Provenge)",
            "Radium-223 dichloride (Xofigo)",
            "Olaparib (Lynparza)",
            "Rucaparib (Rubraca)",
            "Pembrolizumab (Keytruda)",
            "Nivolumab (Opdivo)",
            "Ketoconazole",
            "Estradiol",
            "Vinblastine",
            "Bevacizumab (Avastin)"
        ],
        "scorer": "gpt-4o",
        "judgement": {
            "matches": [
                "Abiraterone acetate (Zytiga)",
                "Enzalutamide (Xtandi)",
                "Apalutamide (Erleada)",
                "Darolutamide (Nubeqa)",
                "Bicalutamide (Casodex)",
                "Flutamide (Eulexin)",
                "Nilutamide (Nilandron)",
                "Docetaxel (Taxotere)",
                "Cabazitaxel (Jevtana)",
                "Mitoxantrone (Novantrone)",
                "Estramustine phosphate",
                "Leuprolide acetate (Leuplin)",
                "Goserelin acetate (Zoladex)",
                "Degarelix (Firmagon)",
                "Sipuleucel-T (Provenge)",
                "Radium-223 dichloride (Xofigo)",
                "Olaparib (Lynparza)",
                "Rucaparib (Rubraca)",
                "Pembrolizumab (Keytruda)",
                "Nivolumab (Opdivo)",
                "Ketoconazole",
                "Estradiol",
                "Vinblastine",
                "Bevacizumab (Avastin)"
            ],
            "mismatches": [],
            "true_referents": [
                "Abiraterone acetate (Zytiga)",
                "Apalutamide (Erleada)",
                "Bevacizumab (Avastin)",
                "Bicalutamide (Casodex)",
                "Cabazitaxel (Jevtana)",
                "Darolutamide (Nubeqa)",
                "Degarelix (Firmagon)",
                "Docetaxel (Taxotere)",
                "Enzalutamide (Xtandi)",
                "Estradiol",
                "Estramustine phosphate",
                "Flutamide (Eulexin)",
                "Goserelin acetate (Zoladex)",
                "Ketoconazole",
                "Leuprolide acetate (Leuplin)",
                "Mitoxantrone (Novantrone)",
                "Nilutamide (Nilandron)",
                "Nivolumab (Opdivo)",
                "Olaparib (Lynparza)",
                "Pembrolizumab (Keytruda)",
                "Radium-223 dichloride (Xofigo)",
                "Rucaparib (Rubraca)",
                "Sipuleucel-T (Provenge)",
                "Vinblastine"
            ],
            "TP": 24,
            "FP": 0,
            "FN": 0
        }
    },
    {
        "test": "limited-list-referents",
        "responder": "anthropic.claude-3-5-sonnet-v1:0",
        "concept": "approved drug for prostate cancer",
        "domain": "medicine",
        "response": [
            "Abiraterone acetate (Zytiga)",
            "Enzalutamide (Xtandi)",
            "Docetaxel (Taxotere)",
            "Cabazitaxel (Jevtana)",
            "Leuprolide acetate (Lupron)",
            "Goserelin acetate (Zoladex)",
            "Triptorelin pamoate (Trelstar)",
            "Degarelix (Firmagon)",
            "Bicalutamide (Casodex)",
            "Flutamide (Eulexin)",
            "Nilutamide (Nilandron)",
            "Apalutamide (Erleada)",
            "Darolutamide (Nubeqa)",
            "Radium-223 dichloride (Xofigo)",
            "Sipuleucel-T (Provenge)",
            "Pembrolizumab (Keytruda)",
            "Olaparib (Lynparza)",
            "Rucaparib (Rubraca)",
            "Relugolix (Orgovyx)",
            "Mitoxantrone (Novantrone)",
            "Estramustine (Emcyt)",
            "Ketoconazole",
            "Prednisone",
            "Denosumab (Xgeva)"
        ],
        "scorer": "gpt-4o",
        "judgement": {
            "matches": [
                "Abiraterone acetate (Zytiga)",
                "Enzalutamide (Xtandi)",
                "Docetaxel (Taxotere)",
                "Cabazitaxel (Jevtana)",
                "Leuprolide acetate (Lupron)",
                "Goserelin acetate (Zoladex)",
                "Triptorelin pamoate (Trelstar)",
                "Degarelix (Firmagon)",
                "Bicalutamide (Casodex)",
                "Flutamide (Eulexin)",
                "Nilutamide (Nilandron)",
                "Apalutamide (Erleada)",
                "Darolutamide (Nubeqa)",
                "Radium-223 dichloride (Xofigo)",
                "Sipuleucel-T (Provenge)",
                "Pembrolizumab (Keytruda)",
                "Olaparib (Lynparza)",
                "Rucaparib (Rubraca)",
                "Relugolix (Orgovyx)",
                "Mitoxantrone (Novantrone)",
                "Estramustine (Emcyt)",
                "Ketoconazole",
                "Prednisone",
                "Denosumab (Xgeva)"
            ],
            "mismatches": [],
            "true_referents": [
                "Abiraterone acetate (Zytiga)",
                "Apalutamide (Erleada)",
                "Bicalutamide (Casodex)",
                "Cabazitaxel (Jevtana)",
                "Darolutamide (Nubeqa)",
                "Degarelix (Firmagon)",
                "Denosumab (Xgeva)",
                "Docetaxel (Taxotere)",
                "Enzalutamide (Xtandi)",
                "Estramustine (Emcyt)",
                "Flutamide (Eulexin)",
                "Goserelin acetate (Zoladex)",
                "Ketoconazole",
                "Leuprolide acetate (Lupron)",
                "Mitoxantrone (Novantrone)",
                "Nilutamide (Nilandron)",
                "Olaparib (Lynparza)",
                "Pembrolizumab (Keytruda)",
                "Prednisone",
                "Radium-223 dichloride (Xofigo)",
                "Relugolix (Orgovyx)",
                "Rucaparib (Rubraca)",
                "Sipuleucel-T (Provenge)",
                "Triptorelin pamoate (Trelstar)"
            ],
            "TP": 24,
            "FP": 0,
            "FN": 0
        }
    },
    {
        "test": "limited-list-referents",
        "responder": "anthropic.claude-3-opus-v1:0",
        "concept": "approved drug for prostate cancer",
        "domain": "medicine",
        "response": [
            "Abiraterone acetate (Zytiga)",
            "Enzalutamide (Xtandi)",
            "Apalutamide (Erleada)",
            "Darolutamide (Nubeqa)",
            "Docetaxel (Taxotere)",
            "Cabazitaxel (Jevtana)",
            "Sipuleucel-T (Provenge)",
            "Radium Ra 223 dichloride (Xofigo)",
            "Degarelix (Firmagon)",
            "Leuprolide acetate (Lupron)",
            "Goserelin acetate (Zoladex)",
            "Triptorelin pamoate (Trelstar)",
            "Histrelin acetate (Vantas)",
            "Flutamide (Eulexin)",
            "Bicalutamide (Casodex)",
            "Nilutamide (Nilandron)",
            "Mitoxantrone (Novantrone)",
            "Estramustine phosphate sodium (Emcyt)",
            "Prednisone",
            "Dexamethasone",
            "Hydrocortisone",
            "Ketoconazole",
            "Olaparib (Lynparza)",
            "Rucaparib (Rubraca)"
        ],
        "scorer": "gpt-4o",
        "judgement": {
            "matches": [
                "Abiraterone acetate (Zytiga)",
                "Enzalutamide (Xtandi)",
                "Apalutamide (Erleada)",
                "Darolutamide (Nubeqa)",
                "Docetaxel (Taxotere)",
                "Cabazitaxel (Jevtana)",
                "Sipuleucel-T (Provenge)",
                "Radium Ra 223 dichloride (Xofigo)",
                "Degarelix (Firmagon)",
                "Leuprolide acetate (Lupron)",
                "Goserelin acetate (Zoladex)",
                "Triptorelin pamoate (Trelstar)",
                "Histrelin acetate (Vantas)",
                "Flutamide (Eulexin)",
                "Bicalutamide (Casodex)",
                "Nilutamide (Nilandron)",
                "Mitoxantrone (Novantrone)",
                "Estramustine phosphate sodium (Emcyt)",
                "Prednisone",
                "Dexamethasone",
                "Hydrocortisone",
                "Ketoconazole",
                "Olaparib (Lynparza)",
                "Rucaparib (Rubraca)"
            ],
            "mismatches": [],
            "true_referents": [
                "Abiraterone acetate (Zytiga)",
                "Apalutamide (Erleada)",
                "Bicalutamide (Casodex)",
                "Cabazitaxel (Jevtana)",
                "Darolutamide (Nubeqa)",
                "Degarelix (Firmagon)",
                "Dexamethasone",
                "Docetaxel (Taxotere)",
                "Enzalutamide (Xtandi)",
                "Estramustine phosphate sodium (Emcyt)",
                "Flutamide (Eulexin)",
                "Goserelin acetate (Zoladex)",
                "Histrelin acetate (Vantas)",
                "Hydrocortisone",
                "Ketoconazole",
                "Leuprolide acetate (Lupron)",
                "Mitoxantrone (Novantrone)",
                "Nilutamide (Nilandron)",
                "Olaparib (Lynparza)",
                "Prednisone",
                "Radium Ra 223 dichloride (Xofigo)",
                "Rucaparib (Rubraca)",
                "Sipuleucel-T (Provenge)",
                "Triptorelin pamoate (Trelstar)"
            ],
            "TP": 24,
            "FP": 0,
            "FN": 0
        }
    },
    {
        "test": "limited-list-referents",
        "responder": "anthropic.claude-3-sonnet-v1:0",
        "concept": "approved drug for prostate cancer",
        "domain": "medicine",
        "response": [
            "Abiraterone Acetate (AA)",
            "Enzalutamide (ENZ)",
            "Docetaxel (DTX)",
            "Cabazitaxel (CBZ)",
            "Sipuleucel-T (SIP-T)",
            "Radium-223 Dichloride (Ra-223)",
            "Leuprolide Acetate (LA)",
            "Goserelin Acetate (GA)",
            "Triptorelin Pamoate (TP)",
            "Bicalutamide (BIC)",
            "Flutamide (FLU)",
            "Nilutamide (NIL)",
            "Degarelix (DEG)",
            "Apalutamide (APA)",
            "Darolutamide (DAR)",
            "Estramustine Phosphate (EMP)",
            "Mitoxantrone (MTX)",
            "Ketoconazole (KET)",
            "Diethylstilbestrol (DES)",
            "Gallium-68 PSMA-11 (Ga-68 PSMA-11)",
            "Lutetium-177 PSMA-617 (Lu-177 PSMA-617)",
            "Olaparib (OLA)",
            "Rucaparib (RUC)",
            "Niraparib (NIR)"
        ],
        "scorer": "gpt-4o",
        "judgement": {
            "matches": [
                "Abiraterone Acetate (AA)",
                "Enzalutamide (ENZ)",
                "Docetaxel (DTX)",
                "Cabazitaxel (CBZ)",
                "Sipuleucel-T (SIP-T)",
                "Radium-223 Dichloride (Ra-223)",
                "Leuprolide Acetate (LA)",
                "Goserelin Acetate (GA)",
                "Triptorelin Pamoate (TP)",
                "Bicalutamide (BIC)",
                "Flutamide (FLU)",
                "Nilutamide (NIL)",
                "Degarelix (DEG)",
                "Apalutamide (APA)",
                "Darolutamide (DAR)",
                "Estramustine Phosphate (EMP)",
                "Mitoxantrone (MTX)",
                "Ketoconazole (KET)",
                "Diethylstilbestrol (DES)",
                "Gallium-68 PSMA-11 (Ga-68 PSMA-11)",
                "Lutetium-177 PSMA-617 (Lu-177 PSMA-617)",
                "Olaparib (OLA)",
                "Rucaparib (RUC)",
                "Niraparib (NIR)"
            ],
            "mismatches": [],
            "true_referents": [
                "Abiraterone Acetate (AA)",
                "Apalutamide (APA)",
                "Bicalutamide (BIC)",
                "Cabazitaxel (CBZ)",
                "Darolutamide (DAR)",
                "Degarelix (DEG)",
                "Diethylstilbestrol (DES)",
                "Docetaxel (DTX)",
                "Enzalutamide (ENZ)",
                "Estramustine Phosphate (EMP)",
                "Flutamide (FLU)",
                "Gallium-68 PSMA-11 (Ga-68 PSMA-11)",
                "Goserelin Acetate (GA)",
                "Ketoconazole (KET)",
                "Leuprolide Acetate (LA)",
                "Lutetium-177 PSMA-617 (Lu-177 PSMA-617)",
                "Mitoxantrone (MTX)",
                "Nilutamide (NIL)",
                "Niraparib (NIR)",
                "Olaparib (OLA)",
                "Radium-223 Dichloride (Ra-223)",
                "Rucaparib (RUC)",
                "Sipuleucel-T (SIP-T)",
                "Triptorelin Pamoate (TP)"
            ],
            "TP": 24,
            "FP": 0,
            "FN": 0
        }
    },
    {
        "test": "limited-list-referents",
        "responder": "anthropic.claude-3-haiku-v1:0",
        "concept": "approved drug for prostate cancer",
        "domain": "medicine",
        "response": [
            "Abiraterone Acetate (Zytiga)",
            "Apalutamide (Erleada)",
            "Cabazitaxel (Jevtana)",
            "Darolutamide (Nubeqa)",
            "Docetaxel (Taxotere)",
            "Enzalutamide (Xtandi)",
            "Estramustine Phosphate (Emcyt)",
            "Flutamide (Eulexin)",
            "Goserelin Acetate (Zoladex)",
            "Leuprolide Acetate (Lupron, Eligard)",
            "Mitoxantrone (Novantrone)",
            "Nivolumab (Opdivo)",
            "Olaparib (Lynparza)",
            "Pembrolizumab (Keytruda)",
            "Prednisone",
            "Radium-223 Dichloride (Xofigo)",
            "Rucaparib (Rubraca)",
            "Sipuleucel-T (Provenge)",
            "Talazoparib (Talzenna)",
            "Triptorelin Pamoate (Trelstar)",
            "Triptorelin Acetate (Trelstar Depot)",
            "Triptorelin Embonate (Trelstar LA)",
            "Valrubicin (Valstar)",
            "Yondelis (Trabectedin)"
        ],
        "scorer": "gpt-4o",
        "judgement": {
            "matches": [
                "Abiraterone Acetate (Zytiga)",
                "Apalutamide (Erleada)",
                "Cabazitaxel (Jevtana)",
                "Darolutamide (Nubeqa)",
                "Docetaxel (Taxotere)",
                "Enzalutamide (Xtandi)",
                "Estramustine Phosphate (Emcyt)",
                "Flutamide (Eulexin)",
                "Goserelin Acetate (Zoladex)",
                "Leuprolide Acetate (Lupron, Eligard)",
                "Mitoxantrone (Novantrone)",
                "Nivolumab (Opdivo)",
                "Olaparib (Lynparza)",
                "Pembrolizumab (Keytruda)",
                "Prednisone",
                "Radium-223 Dichloride (Xofigo)",
                "Rucaparib (Rubraca)",
                "Sipuleucel-T (Provenge)",
                "Talazoparib (Talzenna)",
                "Triptorelin Pamoate (Trelstar)",
                "Triptorelin Acetate (Trelstar Depot)",
                "Triptorelin Embonate (Trelstar LA)",
                "Valrubicin (Valstar)",
                "Yondelis (Trabectedin)"
            ],
            "mismatches": [],
            "true_referents": [
                "Abiraterone Acetate (Zytiga)",
                "Apalutamide (Erleada)",
                "Cabazitaxel (Jevtana)",
                "Darolutamide (Nubeqa)",
                "Docetaxel (Taxotere)",
                "Enzalutamide (Xtandi)",
                "Estramustine Phosphate (Emcyt)",
                "Flutamide (Eulexin)",
                "Goserelin Acetate (Zoladex)",
                "Leuprolide Acetate (Lupron, Eligard)",
                "Mitoxantrone (Novantrone)",
                "Nivolumab (Opdivo)",
                "Olaparib (Lynparza)",
                "Pembrolizumab (Keytruda)",
                "Prednisone",
                "Radium-223 Dichloride (Xofigo)",
                "Rucaparib (Rubraca)",
                "Sipuleucel-T (Provenge)",
                "Talazoparib (Talzenna)",
                "Triptorelin Acetate (Trelstar Depot)",
                "Triptorelin Embonate (Trelstar LA)",
                "Triptorelin Pamoate (Trelstar)",
                "Valrubicin (Valstar)",
                "Yondelis (Trabectedin)"
            ],
            "TP": 24,
            "FP": 0,
            "FN": 0
        }
    },
    {
        "test": "limited-list-referents",
        "responder": "meta.llama3-8b-instruct-v1:0",
        "concept": "approved drug for prostate cancer",
        "domain": "medicine",
        "response": [
            "Bicalutamide (Casodex)",
            "Flutamide",
            "Nilutamide (Nilandron)",
            "Leuprolide (Lupron)",
            "Goserelin (Zoladex)",
            "Buserelin (Suprefact)",
            "Abarelix",
            "Degarelix (Firmagon)",
            "Apalutamide (Erleada)",
            "Enzalutamide (Xtandi)",
            "Cabazitaxel (Jevtana)",
            "Docetaxel (Taxotere)",
            "Mitoxantrone (Novantrone)",
            "Prednisone",
            "Sipuleucel-T (Provenge)",
            "Radium-223 dichloride (Xofigo)",
            "Lutetium-177 dotatate (Lutathera)",
            "Cabozantinib (Cometriq)",
            "Radium-223 dichloride (Xofigo)",
            "Oxaliplatin (Eloxatin)",
            "Paclitaxel (Taxol)",
            "Brentuximab vedotin (Adcetris)",
            "Pembrolizumab (Keytruda)",
            "Nivolumab (Opdivo)",
            "Durvalumab (Imfinzi)"
        ],
        "scorer": "gpt-4o",
        "judgement": {
            "matches": [
                "Bicalutamide (Casodex)",
                "Flutamide",
                "Nilutamide (Nilandron)",
                "Leuprolide (Lupron)",
                "Goserelin (Zoladex)",
                "Buserelin (Suprefact)",
                "Abarelix",
                "Degarelix (Firmagon)",
                "Apalutamide (Erleada)",
                "Enzalutamide (Xtandi)",
                "Cabazitaxel (Jevtana)",
                "Docetaxel (Taxotere)",
                "Mitoxantrone (Novantrone)",
                "Prednisone",
                "Sipuleucel-T (Provenge)",
                "Radium-223 dichloride (Xofigo)",
                "Lutetium-177 dotatate (Lutathera)",
                "Cabozantinib (Cometriq)",
                "Oxaliplatin (Eloxatin)",
                "Paclitaxel (Taxol)",
                "Brentuximab vedotin (Adcetris)",
                "Pembrolizumab (Keytruda)",
                "Nivolumab (Opdivo)"
            ],
            "mismatches": [
                "Durvalumab (Imfinzi)"
            ],
            "true_referents": [
                "Abarelix",
                "Apalutamide (Erleada)",
                "Bicalutamide (Casodex)",
                "Brentuximab vedotin (Adcetris)",
                "Buserelin (Suprefact)",
                "Cabazitaxel (Jevtana)",
                "Cabozantinib (Cometriq)",
                "Degarelix (Firmagon)",
                "Docetaxel (Taxotere)",
                "Enzalutamide (Xtandi)",
                "Flutamide",
                "Goserelin (Zoladex)",
                "Leuprolide (Lupron)",
                "Lutetium-177 dotatate (Lutathera)",
                "Mitoxantrone (Novantrone)",
                "Nilutamide (Nilandron)",
                "Nivolumab (Opdivo)",
                "Oxaliplatin (Eloxatin)",
                "Paclitaxel (Taxol)",
                "Pembrolizumab (Keytruda)",
                "Prednisone",
                "Radium-223 dichloride (Xofigo)",
                "Sipuleucel-T (Provenge)"
            ],
            "TP": 23,
            "FP": 1,
            "FN": 0
        }
    },
    {
        "test": "limited-list-referents",
        "responder": "meta.llama3-70b-instruct-v1:0",
        "concept": "approved drug for prostate cancer",
        "domain": "medicine",
        "response": [
            "Abiraterone (ZYTIGA)",
            "Apalutamide (ERLEADA)",
            "Bicalutamide (CASODEX)",
            "Capzivafusp-tefa",
            "Degarelix (FIRMAGON)",
            "Docetaxel (TAXOTERE)",
            "Enzalutamide (XTANDI)",
            "Flutamide (EULEXIN)",
            "Goserelin (ZOLADEX)",
            "Leuprolide (LUPRON)",
            "Nilutamide (NILANDRON)",
            "Olaparib (LYNPARZA)",
            "Prednisone (DELTASONE)",
            "Ralimetinib",
            "Rucaparib (RUBRACA)",
            "Sipuleucel-T (PROVENGE)",
            "Zoledronic acid (ZOMETA)"
        ],
        "scorer": "gpt-4o",
        "judgement": {
            "matches": [
                "Abiraterone (ZYTIGA)",
                "Apalutamide (ERLEADA)",
                "Bicalutamide (CASODEX)",
                "Capzivafusp-tefa",
                "Degarelix (FIRMAGON)",
                "Docetaxel (TAXOTERE)",
                "Enzalutamide (XTANDI)",
                "Flutamide (EULEXIN)",
                "Goserelin (ZOLADEX)",
                "Leuprolide (LUPRON)",
                "Nilutamide (NILANDRON)",
                "Olaparib (LYNPARZA)",
                "Prednisone (DELTASONE)",
                "Ralimetinib",
                "Rucaparib (RUBRACA)",
                "Sipuleucel-T (PROVENGE)",
                "Zoledronic acid (ZOMETA)"
            ],
            "mismatches": [],
            "true_referents": [
                "Abiraterone (ZYTIGA)",
                "Apalutamide (ERLEADA)",
                "Bicalutamide (CASODEX)",
                "Capzivafusp-tefa",
                "Degarelix (FIRMAGON)",
                "Docetaxel (TAXOTERE)",
                "Enzalutamide (XTANDI)",
                "Flutamide (EULEXIN)",
                "Goserelin (ZOLADEX)",
                "Leuprolide (LUPRON)",
                "Nilutamide (NILANDRON)",
                "Olaparib (LYNPARZA)",
                "Prednisone (DELTASONE)",
                "Ralimetinib",
                "Rucaparib (RUBRACA)",
                "Sipuleucel-T (PROVENGE)",
                "Zoledronic acid (ZOMETA)"
            ],
            "TP": 17,
            "FP": 0,
            "FN": 0
        }
    },
    {
        "test": "limited-list-referents",
        "responder": "amazon.titan-text-express-v1",
        "concept": "approved drug for prostate cancer",
        "domain": "medicine",
        "response": [
            {
                "Referent": "Abiraterone",
                "Canonical Name": "Abiraterone Acetate (ABI)"
            },
            {
                "Referent": "Bicalutamide",
                "Canonical Name": "Bicalutamide (BIC)"
            },
            {
                "Referent": "Enzalutamide",
                "Canonical Name": "Enzalutamide (ENZ)"
            },
            {
                "Referent": "Docetaxel",
                "Canonical Name": "Docetaxel (DOC)"
            },
            {
                "Referent": "Goserelin",
                "Canonical Name": "Goserelin (GOS)"
            },
            {
                "Referent": "Leuprolide",
                "Canonical Name": "Leuprolide (LEU)"
            },
            {
                "Referent": "Sipuleucel-T",
                "Canonical Name": "Sipuleucel-T (SIP)"
            },
            {
                "Referent": "Trelstar",
                "Canonical Name": "Trelstar (TREL)"
            }
        ],
        "scorer": "gpt-4o",
        "judgement": {
            "matches": [
                "Abiraterone",
                "Bicalutamide",
                "Enzalutamide",
                "Docetaxel",
                "Goserelin",
                "Leuprolide",
                "Sipuleucel-T",
                "Trelstar"
            ],
            "mismatches": [],
            "true_referents": [
                "{\"Referent\": \"Abiraterone\", \"Canonical Name\": \"Abiraterone Acetate (ABI)\"}",
                "{\"Referent\": \"Bicalutamide\", \"Canonical Name\": \"Bicalutamide (BIC)\"}",
                "{\"Referent\": \"Docetaxel\", \"Canonical Name\": \"Docetaxel (DOC)\"}",
                "{\"Referent\": \"Enzalutamide\", \"Canonical Name\": \"Enzalutamide (ENZ)\"}",
                "{\"Referent\": \"Goserelin\", \"Canonical Name\": \"Goserelin (GOS)\"}",
                "{\"Referent\": \"Leuprolide\", \"Canonical Name\": \"Leuprolide (LEU)\"}",
                "{\"Referent\": \"Sipuleucel-T\", \"Canonical Name\": \"Sipuleucel-T (SIP)\"}",
                "{\"Referent\": \"Trelstar\", \"Canonical Name\": \"Trelstar (TREL)\"}"
            ],
            "TP": 8,
            "FP": 0,
            "FN": 0
        }
    }
]