[
    {
        "test": "limited-list-referents",
        "responder": "qwen-v2.5-14b-instruct",
        "concept": "approved drug for lung cancer",
        "domain": "medicine",
        "response": [
            "Pembrolizumab (Keytruda)",
            "Nivolumab (Opdivo)",
            "Atezolizumab (Tecentriq)",
            "Durvalumab (Imfinzi)",
            "Cetuximab (Erbitux)",
            "Docetaxel (Taxotere)",
            "Osimertinib (Tagrisso)",
            "Crizotinib (Xalkori)",
            "Afatinib (Gilotrif)",
            "Dabrafenib (Tafinlar)",
            "Vemurafenib (Zelboraf)",
            "Neratinib (Nerlynx)",
            "Erlotinib (Tarceva)",
            "Gefitinib (Iressa)",
            "Ipilimumab (Yervoy)",
            "Ramucirumab (Cyramza)",
            "Amivantamab (Rybrevant)",
            "Sacituzumab Govitecan (Trodelvy)",
            "Tecentriq + Avastin + chemotherapy",
            "Larotrectinib (Vitrakvi)",
            "Selpercatinib (Retevmo)",
            "Dacomitinib (Vizimpro)",
            "Cabozantinib (Cometriq)",
            "Pazopanib (Votrient)"
        ],
        "scorer": "gpt-4o",
        "judgement": {
            "matches": [
                "Pembrolizumab (Keytruda)",
                "Nivolumab (Opdivo)",
                "Atezolizumab (Tecentriq)",
                "Durvalumab (Imfinzi)",
                "Docetaxel (Taxotere)",
                "Osimertinib (Tagrisso)",
                "Crizotinib (Xalkori)",
                "Afatinib (Gilotrif)",
                "Dabrafenib (Tafinlar)",
                "Erlotinib (Tarceva)",
                "Gefitinib (Iressa)",
                "Ipilimumab (Yervoy)",
                "Ramucirumab (Cyramza)",
                "Amivantamab (Rybrevant)",
                "Selpercatinib (Retevmo)",
                "Dacomitinib (Vizimpro)"
            ],
            "mismatches": [
                "Cetuximab (Erbitux)",
                "Vemurafenib (Zelboraf)",
                "Neratinib (Nerlynx)",
                "Sacituzumab Govitecan (Trodelvy)",
                "Tecentriq + Avastin + chemotherapy",
                "Larotrectinib (Vitrakvi)",
                "Cabozantinib (Cometriq)",
                "Pazopanib (Votrient)"
            ],
            "true_referents": [
                "Amivantamab-vmjw",
                "Atezolizumab",
                "Avastin (Bevacizumab)",
                "Ceritinib",
                "Crizotinib",
                "Cyramza (Ramucirumab)",
                "Dabrafenib Mesylate",
                "Dacomitinib",
                "Docetaxel",
                "Durvalumab",
                "Enhertu (Fam-Trastuzumab Deruxtecan-nxki)",
                "Entrectinib",
                "Erlotinib Hydrochloride",
                "Gefitinib",
                "Gilotrif (Afatinib Dimaleate)",
                "Imfinzi (Durvalumab)",
                "Ipilimumab",
                "Iressa (Gefitinib)",
                "Keytruda (Pembrolizumab)",
                "Lorbrena (Lorlatinib)",
                "Lorlatinib",
                "Necitumumab",
                "Nivolumab",
                "Opdivo (Nivolumab)",
                "Osimertinib Mesylate",
                "Paclitaxel",
                "Pembrolizumab",
                "Ramucirumab",
                "Repotrectinib",
                "Retevmo (Selpercatinib)",
                "Rybrevant (Amivantamab-vmjw)",
                "Selpercatinib",
                "Tafinlar (Dabrafenib Mesylate)",
                "Tagrisso (Osimertinib Mesylate)",
                "Tarceva (Erlotinib Hydrochloride)",
                "Taxotere (Docetaxel)",
                "Tecentriq (Atezolizumab)",
                "Tepmetko (Tepotinib Hydrochloride)",
                "Vizimpro (Dacomitinib)",
                "Xalkori (Crizotinib)",
                "Yervoy (Ipilimumab)"
            ],
            "TP": 16,
            "FP": 8,
            "FN": 0
        }
    },
    {
        "test": "limited-list-referents",
        "responder": "phi-v4",
        "concept": "approved drug for lung cancer",
        "domain": "medicine",
        "response": [
            "Pembrolizumab (KEYTRUDA)",
            "Nivolumab (OPDIVO)",
            "Atezolizumab (TECENTRIQ)",
            "Durvalumab (IMFINZI)",
            "Sotorasib (LUMAKRAS)",
            "Osimertinib (TAGRISSO)",
            "Erlotinib (Tarceva)",
            "Afatinib (Gilotrif)",
            "Crizotinib (XALKORI)",
            "Ceritinib (Zykadia)",
            "Alectinib (ALECLUZEN)",
            "Chemotherapy (Combination of drugs like Cisplatin and Paclitaxel)",
            "Bevacizumab (AVASTIN)",
            "Ramucirumab (CYRAMZA)",
            "Docetaxel (DOCETAXEL)",
            "Pemetrexed (ALIMTA)",
            "Vinorelbine (Navelbine)",
            "Paclitaxel (Taxol)",
            "Carboplatin (CARBOPLATIN)",
            "Etoposide (VP-16)",
            "Cytarabine (Cytosar-U)",
            "Gemcitabine (Gemzar)",
            "Methotrexate (TREXALL)",
            "Cisplatin (Platinol)"
        ],
        "scorer": "gpt-4o",
        "judgement": {
            "matches": [
                "Pembrolizumab",
                "Nivolumab",
                "Atezolizumab",
                "Durvalumab",
                "Sotorasib",
                "Osimertinib Mesylate",
                "Erlotinib Hydrochloride",
                "Crizotinib",
                "Ceritinib",
                "Bevacizumab",
                "Ramucirumab",
                "Docetaxel",
                "Pemetrexed Disodium",
                "Etoposide",
                "Gemcitabine Hydrochloride",
                "Methotrexate Sodium"
            ],
            "mismatches": [
                "Alectinib (ALECLUZEN)",
                "Chemotherapy (Combination of drugs like Cisplatin and Paclitaxel)",
                "Vinorelbine (Navelbine)",
                "Paclitaxel (Taxol)",
                "Carboplatin (CARBOPLATIN)",
                "Cytarabine (Cytosar-U)",
                "Cisplatin (Platinol)"
            ],
            "true_referents": [
                "Alecensa (Alectinib)",
                "Alectinib",
                "Alimta (Pemetrexed Disodium)",
                "Alymsys (Bevacizumab)",
                "Atezolizumab",
                "Avastin (Bevacizumab)",
                "Bevacizumab",
                "Binimetinib",
                "Ceritinib",
                "Crizotinib",
                "Cyramza (Ramucirumab)",
                "Docetaxel",
                "Durvalumab",
                "Erlotinib Hydrochloride",
                "Etopophos (Etoposide Phosphate)",
                "Etoposide",
                "Etoposide Phosphate",
                "Gefitinib",
                "Gemcitabine Hydrochloride",
                "Gemzar (Gemcitabine Hydrochloride)",
                "Gilotrif (Afatinib Dimaleate)",
                "Imfinzi (Durvalumab)",
                "Infugem (Gemcitabine Hydrochloride)",
                "Keytruda (Pembrolizumab)",
                "Lorbrena (Lorlatinib)",
                "Lumakras (Sotorasib)",
                "Methotrexate Sodium",
                "Nivolumab",
                "Opdivo (Nivolumab)",
                "Osimertinib Mesylate",
                "Paclitaxel",
                "Pembrolizumab",
                "Pemetrexed Disodium",
                "Ramucirumab",
                "Sotorasib",
                "Tagrisso (Osimertinib Mesylate)",
                "Tarceva (Erlotinib Hydrochloride)",
                "Taxotere (Docetaxel)",
                "Tecentriq (Atezolizumab)",
                "Vinorelbine Tartrate",
                "Xalkori (Crizotinib)",
                "Zykadia (Ceritinib)"
            ],
            "TP": 16,
            "FP": 7,
            "FN": 0
        }
    },
    {
        "test": "limited-list-referents",
        "responder": "mistral-small-instruct-24B",
        "concept": "approved drug for lung cancer",
        "domain": "medicine",
        "response": [
            "Alemtuzumab (Campath)",
            "Alimta (Pemetrexed)",
            "Avastin (Bevacizumab)",
            "Crizotinib (Xalkori)",
            "Cyramza (Ramucirumab)",
            "Durvalumab (Imfinzi)",
            "Erlotinib (Tarceva)",
            "Fam-Trastuzumab Deruxtecan (Enhertu)",
            "Gefitinib (Iressa)",
            "Imcivree (Setmelanotide)",
            "Lorlatinib (Lorbrena)",
            "Nivolumab (Opdivo)",
            "Osimertinib (Tagrisso)",
            "Pazopanib (Votrient)",
            "Pembrolizumab (Keytruda)",
            "Rucaparib (Rubraca)",
            "Sunitinib (Sutent)",
            "Tagrisso (Osimertinib)",
            "Tarceva (Erlotinib)",
            "Tecentriq (Atezolizumab)",
            "Vinorelbine",
            "Xalkori (Crizotinib)",
            "Xtandi (Enzalutamide)",
            "Zykadia (Ceritinib)"
        ],
        "scorer": "gpt-4o",
        "judgement": {
            "matches": [
                "Avastin (Bevacizumab)",
                "Cyramza (Ramucirumab)",
                "Durvalumab (Imfinzi)",
                "Gefitinib (Iressa)",
                "Lorlatinib (Lorbrena)",
                "Nivolumab (Opdivo)",
                "Pembrolizumab (Keytruda)",
                "Tagrisso (Osimertinib)",
                "Tarceva (Erlotinib)",
                "Tecentriq (Atezolizumab)",
                "Xalkori (Crizotinib)",
                "Zykadia (Ceritinib)"
            ],
            "mismatches": [
                "Alemtuzumab (Campath)",
                "Alimta (Pemetrexed)",
                "Crizotinib (Xalkori)",
                "Erlotinib (Tarceva)",
                "Fam-Trastuzumab Deruxtecan (Enhertu)",
                "Imcivree (Setmelanotide)",
                "Osimertinib (Tagrisso)",
                "Pazopanib (Votrient)",
                "Rucaparib (Rubraca)",
                "Sunitinib (Sutent)",
                "Vinorelbine",
                "Xtandi (Enzalutamide)"
            ],
            "true_referents": [
                "Alimta (Pemetrexed Disodium)",
                "Alymsys (Bevacizumab)",
                "Atezolizumab",
                "Augtyro (Repotrectinib)",
                "Avastin (Bevacizumab)",
                "Bevacizumab",
                "Brigatinib",
                "Ceritinib",
                "Crizotinib",
                "Cyramza (Ramucirumab)",
                "Docetaxel",
                "Durvalumab",
                "Enhertu (Fam-Trastuzumab Deruxtecan-nxki)",
                "Ensartinib Hydrochloride",
                "Erlotinib Hydrochloride",
                "Fam-Trastuzumab Deruxtecan-nxki",
                "Gefitinib",
                "Imfinzi (Durvalumab)",
                "Imjudo (Tremelimumab-actl)",
                "Iressa (Gefitinib)",
                "Keytruda (Pembrolizumab)",
                "Lorbrena (Lorlatinib)",
                "Lorlatinib",
                "Nivolumab",
                "Opdivo (Nivolumab)",
                "Osimertinib Mesylate",
                "Pembrolizumab",
                "Pemetrexed Disodium",
                "Portrazza (Necitumumab)",
                "Ramucirumab",
                "Tagrisso (Osimertinib Mesylate)",
                "Tarceva (Erlotinib Hydrochloride)",
                "Taxotere (Docetaxel)",
                "Tecentriq (Atezolizumab)",
                "Vinorelbine Tartrate",
                "Vizimpro (Dacomitinib)",
                "Xalkori (Crizotinib)",
                "Zykadia (Ceritinib)"
            ],
            "TP": 12,
            "FP": 12,
            "FN": 0
        }
    },
    {
        "test": "limited-list-referents",
        "responder": "gemma-3",
        "concept": "approved drug for lung cancer",
        "domain": "medicine",
        "response": [
            "Cisplatin (CIS)",
            "Carboplatin (CARBO)",
            "Paclitaxel (TAX)",
            "Docetaxel (DOC)",
            "Gemcitabine (GEM)",
            "Vinorelbine (VIN)",
            "Pemetrexed (PEM)",
            "Erlotinib (ERL)",
            "Gefitinib (GEF)",
            "Afatinib (AFA)",
            "Osimertinib (OSI)",
            "Crizotinib (CRIZ)",
            "Ceritinib (CERI)",
            "Alectinib (ALEC)",
            "Brigatinib (BRIGA)",
            "Lorlatinib (LORA)",
            "Trametinib (TRA)",
            "Dabrafenib (DAB)",
            "Sotorasib (SOT)",
            "Adagrasib (ADA)",
            "Bevacizumab (BEV)",
            "Ramucirumab (RAM)",
            "Pembrolizumab (PEMBRO)",
            "Nivolumab (NIVO)"
        ],
        "scorer": "gpt-4o",
        "judgement": {
            "matches": [
                "Paclitaxel",
                "Docetaxel",
                "Gemcitabine",
                "Vinorelbine",
                "Pemetrexed",
                "Erlotinib",
                "Gefitinib",
                "Afatinib",
                "Osimertinib",
                "Crizotinib",
                "Ceritinib",
                "Alectinib",
                "Brigatinib",
                "Lorlatinib",
                "Dabrafenib",
                "Sotorasib",
                "Adagrasib",
                "Bevacizumab",
                "Ramucirumab",
                "Pembrolizumab",
                "Nivolumab"
            ],
            "mismatches": [
                "Cisplatin",
                "Carboplatin",
                "Trametinib"
            ],
            "true_referents": [
                "Adagrasib",
                "Afatinib Dimaleate",
                "Alecensa (Alectinib)",
                "Alectinib",
                "Alimta (Pemetrexed Disodium)",
                "Alunbrig (Brigatinib)",
                "Avastin (Bevacizumab)",
                "Bevacizumab",
                "Binimetinib",
                "Brigatinib",
                "Ceritinib",
                "Crizotinib",
                "Cyramza (Ramucirumab)",
                "Dabrafenib Mesylate",
                "Dacomitinib",
                "Docetaxel",
                "Erlotinib Hydrochloride",
                "Gefitinib",
                "Gemcitabine Hydrochloride",
                "Gemzar (Gemcitabine Hydrochloride)",
                "Infugem (Gemcitabine Hydrochloride)",
                "Iressa (Gefitinib)",
                "Keytruda (Pembrolizumab)",
                "Krazati (Adagrasib)",
                "Lorbrena (Lorlatinib)",
                "Lorlatinib",
                "Lumakras (Sotorasib)",
                "Nivolumab",
                "Opdivo (Nivolumab)",
                "Osimertinib Mesylate",
                "Paclitaxel",
                "Pembrolizumab",
                "Pemetrexed Disodium",
                "Pralsetinib",
                "Ramucirumab",
                "Sotorasib",
                "Tafinlar (Dabrafenib Mesylate)",
                "Tagrisso (Osimertinib Mesylate)",
                "Tarceva (Erlotinib Hydrochloride)",
                "Taxotere (Docetaxel)",
                "Vinorelbine Tartrate",
                "Xalkori (Crizotinib)",
                "Zirabev (Bevacizumab)"
            ],
            "TP": 21,
            "FP": 3,
            "FN": 0
        }
    },
    {
        "test": "limited-list-referents",
        "responder": "gpt-4o",
        "concept": "approved drug for lung cancer",
        "domain": "medicine",
        "response": [
            "Gefitinib (Iressa)",
            "Erlotinib (Tarceva)",
            "Afatinib (Gilotrif)",
            "Osimertinib (Tagrisso)",
            "Crizotinib (Xalkori)",
            "Ceritinib (Zykadia)",
            "Alectinib (Alecensa)",
            "Brigatinib (Alunbrig)",
            "Lorlatinib (Lorbrena)",
            "Dabrafenib (Tafinlar)",
            "Trametinib (Mekinist)",
            "Pembrolizumab (Keytruda)",
            "Nivolumab (Opdivo)",
            "Atezolizumab (Tecentriq)",
            "Durvalumab (Imfinzi)",
            "Avelumab (Bavencio)",
            "Ramucirumab (Cyramza)",
            "Bevacizumab (Avastin)",
            "Pemetrexed (Alimta)",
            "Docetaxel (Taxotere)",
            "Gemcitabine (Gemzar)",
            "Cisplatin",
            "Carboplatin",
            "Paclitaxel (Taxol)"
        ],
        "scorer": "gpt-4o",
        "judgement": {
            "matches": [
                "Gefitinib (Iressa)",
                "Erlotinib (Tarceva)",
                "Afatinib (Gilotrif)",
                "Osimertinib (Tagrisso)",
                "Crizotinib (Xalkori)",
                "Ceritinib (Zykadia)",
                "Alectinib (Alecensa)",
                "Brigatinib (Alunbrig)",
                "Lorlatinib (Lorbrena)",
                "Dabrafenib (Tafinlar)",
                "Trametinib (Mekinist)",
                "Pembrolizumab (Keytruda)",
                "Nivolumab (Opdivo)",
                "Atezolizumab (Tecentriq)",
                "Durvalumab (Imfinzi)",
                "Ramucirumab (Cyramza)",
                "Bevacizumab (Avastin)",
                "Pemetrexed (Alimta)",
                "Docetaxel (Taxotere)",
                "Gemcitabine (Gemzar)"
            ],
            "mismatches": [
                "Avelumab (Bavencio)",
                "Cisplatin",
                "Carboplatin",
                "Paclitaxel (Taxol)"
            ],
            "true_referents": [
                "Alecensa (Alectinib)",
                "Alectinib",
                "Alimta (Pemetrexed Disodium)",
                "Alunbrig (Brigatinib)",
                "Alymsys (Bevacizumab)",
                "Amivantamab-vmjw",
                "Atezolizumab",
                "Avastin (Bevacizumab)",
                "Bevacizumab",
                "Binimetinib",
                "Brigatinib",
                "Ceritinib",
                "Crizotinib",
                "Cyramza (Ramucirumab)",
                "Dabrafenib Mesylate",
                "Docetaxel",
                "Durvalumab",
                "Erlotinib Hydrochloride",
                "Gefitinib",
                "Gemcitabine Hydrochloride",
                "Gemzar (Gemcitabine Hydrochloride)",
                "Gilotrif (Afatinib Dimaleate)",
                "Imfinzi (Durvalumab)",
                "Infugem (Gemcitabine Hydrochloride)",
                "Iressa (Gefitinib)",
                "Keytruda (Pembrolizumab)",
                "Lorbrena (Lorlatinib)",
                "Lorlatinib",
                "Mekinist (Trametinib Dimethyl Sulfoxide)",
                "Nivolumab",
                "Opdivo (Nivolumab)",
                "Osimertinib Mesylate",
                "Paclitaxel",
                "Pembrolizumab",
                "Pemetrexed Disodium",
                "Ramucirumab",
                "Tafinlar (Dabrafenib Mesylate)",
                "Tagrisso (Osimertinib Mesylate)",
                "Tarceva (Erlotinib Hydrochloride)",
                "Taxotere (Docetaxel)",
                "Tecentriq (Atezolizumab)",
                "Trametinib Dimethyl Sulfoxide",
                "Xalkori (Crizotinib)",
                "Zykadia (Ceritinib)"
            ],
            "TP": 20,
            "FP": 4,
            "FN": 0
        }
    },
    {
        "test": "limited-list-referents",
        "responder": "gpt-4o-mini",
        "concept": "approved drug for lung cancer",
        "domain": "medicine",
        "response": [
            "Atezolizumab (TECENTRIQ)",
            "Nivolumab (OPDIVO)",
            "Pembrolizumab (KEYTRUDA)",
            "Erlotinib ( TARCEVA)",
            "Gefitinib (IRESSA)",
            "Afatinib (GILOTRIF)",
            "Osimertinib (TAGRISSO)",
            "Dacomitinib (VERUCA)",
            "Crizotinib (XALKORI)",
            "Ceritinib (ZYKADIA)",
            "Alectinib (ALECENSA)",
            "Brigatinib (ALUNBRIG)",
            "Entrectinib (RYBREVANT)",
            "Lorlatinib (LORBRENA)",
            "Bevacizumab (AVASTIN)",
            "Docetaxel (TAXOTERE)",
            "Paclitaxel (TAXOL)",
            "Vinorelbine (NAVELBINE)",
            "Carboplatin (PARAPLATIN)",
            "Cisplatin (PLATINOL)",
            "Pemetrexed (ALIMTA)",
            "Lurbinectedin (ZEPZELCA)",
            "Tazemetostat (TAZVERIK)",
            "Selpercatinib (LOXO-292)",
            "Entrectinib (RYBREVANT)"
        ],
        "scorer": "gpt-4o",
        "judgement": {
            "matches": [
                "Atezolizumab",
                "Nivolumab",
                "Pembrolizumab",
                "Erlotinib Hydrochloride",
                "Gefitinib",
                "Afatinib Dimaleate",
                "Osimertinib Mesylate",
                "Dacomitinib",
                "Crizotinib",
                "Ceritinib",
                "Alectinib",
                "Brigatinib",
                "Lorlatinib",
                "Bevacizumab",
                "Docetaxel",
                "Paclitaxel",
                "Vinorelbine Tartrate",
                "Pemetrexed Disodium",
                "Lurbinectedin",
                "Selpercatinib"
            ],
            "mismatches": [
                "Entrectinib (RYBREVANT)",
                "Vinorelbine (NAVELBINE)",
                "Carboplatin (PARAPLATIN)",
                "Cisplatin (PLATINOL)",
                "Tazemetostat (TAZVERIK)",
                "Selpercatinib (LOXO-292)"
            ],
            "true_referents": [
                "Alecensa (Alectinib)",
                "Alectinib",
                "Alimta (Pemetrexed Disodium)",
                "Alunbrig (Brigatinib)",
                "Alymsys (Bevacizumab)",
                "Atezolizumab",
                "Avastin (Bevacizumab)",
                "Bevacizumab",
                "Binimetinib",
                "Brigatinib",
                "Ceritinib",
                "Crizotinib",
                "Dacomitinib",
                "Docetaxel",
                "Encorafenib",
                "Entrectinib",
                "Erlotinib Hydrochloride",
                "Etopophos (Etoposide Phosphate)",
                "Gefitinib",
                "Gilotrif (Afatinib Dimaleate)",
                "Iressa (Gefitinib)",
                "Keytruda (Pembrolizumab)",
                "Lazcluze (Lazertinib Mesylate Hydrate)",
                "Lorbrena (Lorlatinib)",
                "Lorlatinib",
                "Lurbinectedin",
                "Nivolumab",
                "Opdivo (Nivolumab)",
                "Osimertinib Mesylate",
                "Paclitaxel",
                "Pembrolizumab",
                "Pemetrexed Disodium",
                "Retevmo (Selpercatinib)",
                "Rozlytrek (Entrectinib)",
                "Selpercatinib",
                "Tagrisso (Osimertinib Mesylate)",
                "Tarceva (Erlotinib Hydrochloride)",
                "Taxotere (Docetaxel)",
                "Tecentriq (Atezolizumab)",
                "Vinorelbine Tartrate",
                "Vizimpro (Dacomitinib)",
                "Xalkori (Crizotinib)",
                "Zepzelca (Lurbinectedin)",
                "Zykadia (Ceritinib)"
            ],
            "TP": 20,
            "FP": 6,
            "FN": 0
        }
    },
    {
        "test": "limited-list-referents",
        "responder": "gpt-4-32k",
        "concept": "approved drug for lung cancer",
        "domain": "medicine",
        "response": [
            "Atezolizumab (Tecentriq)",
            "Bevacizumab (Avastin)",
            "Afatinib (Gilotrif)",
            "Alectinib (Alecensa)",
            "Brigatinib (Alunbrig)",
            "Ceritinib (Zykadia)",
            "Crizotinib (Xalkori)",
            "Dabrafenib (Tafinlar)",
            "Docetaxel (Taxotere)",
            "Erlotinib (Tarceva)",
            "Gefitinib (Iressa)",
            "Nivolumab (Opdivo)",
            "Osimertinib (Tagrisso)",
            "Pembrolizumab (Keytruda)",
            "Ramucirumab (Cyramza)",
            "Sunitinib (Sutent)",
            "Trametinib (Mekinist)",
            "Vinorelbine (Navelbine)",
            "Carboplatin (Paraplatin)",
            "Cisplatin (Platinol)",
            "Gemcitabine (Gemzar)",
            "Pemetrexed (Alimta)",
            "Paclitaxel (Taxol)",
            "Doxorubicin (Adriamycin)"
        ],
        "scorer": "gpt-4o",
        "judgement": {
            "matches": [
                "Alectinib",
                "Bevacizumab",
                "Brigatinib",
                "Ceritinib",
                "Crizotinib",
                "Dabrafenib Mesylate",
                "Docetaxel",
                "Erlotinib Hydrochloride",
                "Gefitinib",
                "Nivolumab",
                "Osimertinib Mesylate",
                "Pembrolizumab",
                "Ramucirumab",
                "Trametinib Dimethyl Sulfoxide",
                "Gemcitabine Hydrochloride",
                "Pemetrexed Disodium",
                "Paclitaxel"
            ],
            "mismatches": [
                "Atezolizumab (Tecentriq)",
                "Afatinib (Gilotrif)",
                "Sunitinib (Sutent)",
                "Vinorelbine (Navelbine)",
                "Carboplatin (Paraplatin)",
                "Cisplatin (Platinol)",
                "Doxorubicin (Adriamycin)"
            ],
            "true_referents": [
                "Alecensa (Alectinib)",
                "Alectinib",
                "Alimta (Pemetrexed Disodium)",
                "Alunbrig (Brigatinib)",
                "Alymsys (Bevacizumab)",
                "Atezolizumab",
                "Avastin (Bevacizumab)",
                "Bevacizumab",
                "Binimetinib",
                "Brigatinib",
                "Ceritinib",
                "Crizotinib",
                "Cyramza (Ramucirumab)",
                "Dabrafenib Mesylate",
                "Docetaxel",
                "Doxorubicin Hydrochloride",
                "Erlotinib Hydrochloride",
                "Etopophos (Etoposide Phosphate)",
                "Gefitinib",
                "Gemcitabine Hydrochloride",
                "Gemzar (Gemcitabine Hydrochloride)",
                "Gilotrif (Afatinib Dimaleate)",
                "Infugem (Gemcitabine Hydrochloride)",
                "Iressa (Gefitinib)",
                "Keytruda (Pembrolizumab)",
                "Lorbrena (Lorlatinib)",
                "Mekinist (Trametinib Dimethyl Sulfoxide)",
                "Nivolumab",
                "Opdivo (Nivolumab)",
                "Osimertinib Mesylate",
                "Paclitaxel",
                "Pembrolizumab",
                "Pemetrexed Disodium",
                "Ramucirumab",
                "Tafinlar (Dabrafenib Mesylate)",
                "Tagrisso (Osimertinib Mesylate)",
                "Tarceva (Erlotinib Hydrochloride)",
                "Taxotere (Docetaxel)",
                "Tecentriq (Atezolizumab)",
                "Trametinib Dimethyl Sulfoxide",
                "Vinorelbine Tartrate",
                "Xalkori (Crizotinib)",
                "Zykadia (Ceritinib)"
            ],
            "TP": 17,
            "FP": 7,
            "FN": 0
        }
    },
    {
        "test": "limited-list-referents",
        "responder": "gpt-35-turbo-16k",
        "concept": "approved drug for lung cancer",
        "domain": "medicine",
        "response": [
            "Alectinib (ALK inhibitor)",
            "Crizotinib (ALK inhibitor)",
            "Erlotinib (EGFR inhibitor)",
            "Afatinib (EGFR inhibitor)",
            "Osimertinib (EGFR inhibitor)",
            "Gefitinib (EGFR inhibitor)",
            "Nivolumab (PD-1 inhibitor)",
            "Pembrolizumab (PD-1 inhibitor)",
            "Atezolizumab (PD-L1 inhibitor)",
            "Durvalumab (PD-L1 inhibitor)",
            "Bevacizumab (VEGF inhibitor)",
            "Ramucirumab (VEGFR inhibitor)",
            "Ceritinib (ALK inhibitor)",
            "Brigatinib (ALK inhibitor)",
            "Dabrafenib (BRAF inhibitor)",
            "Trametinib (MEK inhibitor)",
            "Vemurafenib (BRAF inhibitor)",
            "Cobimetinib (MEK inhibitor)",
            "Osimertinib (EGFR inhibitor)",
            "Alectinib (ALK inhibitor)",
            "Crizotinib (ALK inhibitor)",
            "Pembrolizumab (PD-1 inhibitor)",
            "Atezolizumab (PD-L1 inhibitor)",
            "Nivolumab (PD-1 inhibitor)"
        ],
        "scorer": "gpt-4o",
        "judgement": {
            "matches": [
                "Alectinib",
                "Crizotinib",
                "Afatinib",
                "Osimertinib",
                "Gefitinib",
                "Nivolumab",
                "Pembrolizumab",
                "Atezolizumab",
                "Durvalumab",
                "Bevacizumab",
                "Ramucirumab",
                "Ceritinib",
                "Brigatinib",
                "Dabrafenib",
                "Trametinib"
            ],
            "mismatches": [
                "Erlotinib",
                "Vemurafenib",
                "Cobimetinib"
            ],
            "true_referents": [
                "Afatinib Dimaleate",
                "Alecensa (Alectinib)",
                "Alectinib",
                "Alunbrig (Brigatinib)",
                "Alymsys (Bevacizumab)",
                "Atezolizumab",
                "Avastin (Bevacizumab)",
                "Bevacizumab",
                "Binimetinib",
                "Brigatinib",
                "Ceritinib",
                "Crizotinib",
                "Dabrafenib Mesylate",
                "Durvalumab",
                "Gefitinib",
                "Ipilimumab",
                "Keytruda (Pembrolizumab)",
                "Mekinist (Trametinib Dimethyl Sulfoxide)",
                "Nivolumab",
                "Opdivo (Nivolumab)",
                "Osimertinib Mesylate",
                "Pembrolizumab",
                "Ramucirumab",
                "Xalkori (Crizotinib)"
            ],
            "TP": 15,
            "FP": 3,
            "FN": 0
        }
    },
    {
        "test": "limited-list-referents",
        "responder": "o1-mini",
        "concept": "approved drug for lung cancer",
        "domain": "medicine",
        "response": [
            "Cisplatin",
            "Carboplatin",
            "Paclitaxel",
            "Docetaxel",
            "Vinorelbine",
            "Etoposide",
            "Pemetrexed",
            "Gefitinib (Iressa)",
            "Erlotinib (Tarceva)",
            "Afatinib (Gilotrif)",
            "Osimertinib (Tagrisso)",
            "Crizotinib (Xalkori)",
            "Ceritinib (Zykadia)",
            "Alectinib (Alecensa)",
            "Brigatinib (Alunbrig)",
            "Lorlatinib (Lorbrena)",
            "Bevacizumab (Avastin)",
            "Ramucirumab (Cyramza)",
            "Nivolumab (Opdivo)",
            "Pembrolizumab (Keytruda)",
            "Atezolizumab (Tecentriq)",
            "Durvalumab (Imfinzi)",
            "Ipilimumab (Yervoy)",
            "Sotorasib (Lumakras)"
        ],
        "scorer": "gpt-4o",
        "judgement": {
            "matches": [
                "Paclitaxel",
                "Docetaxel",
                "Etoposide",
                "Gefitinib",
                "Erlotinib",
                "Afatinib",
                "Osimertinib",
                "Crizotinib",
                "Ceritinib",
                "Alectinib",
                "Brigatinib",
                "Lorlatinib",
                "Bevacizumab",
                "Ramucirumab",
                "Nivolumab",
                "Pembrolizumab",
                "Atezolizumab",
                "Durvalumab",
                "Ipilimumab",
                "Sotorasib"
            ],
            "mismatches": [
                "Cisplatin",
                "Carboplatin",
                "Vinorelbine",
                "Pemetrexed"
            ],
            "true_referents": [
                "Alecensa (Alectinib)",
                "Alectinib",
                "Alunbrig (Brigatinib)",
                "Alymsys (Bevacizumab)",
                "Atezolizumab",
                "Avastin (Bevacizumab)",
                "Bevacizumab",
                "Binimetinib",
                "Brigatinib",
                "Ceritinib",
                "Crizotinib",
                "Cyramza (Ramucirumab)",
                "Docetaxel",
                "Durvalumab",
                "Erlotinib Hydrochloride",
                "Etopophos (Etoposide Phosphate)",
                "Etoposide",
                "Etoposide Phosphate",
                "Gefitinib",
                "Gilotrif (Afatinib Dimaleate)",
                "Imfinzi (Durvalumab)",
                "Ipilimumab",
                "Iressa (Gefitinib)",
                "Keytruda (Pembrolizumab)",
                "Lorbrena (Lorlatinib)",
                "Lorlatinib",
                "Lumakras (Sotorasib)",
                "Nivolumab",
                "Opdivo (Nivolumab)",
                "Osimertinib Mesylate",
                "Paclitaxel",
                "Pembrolizumab",
                "Pemetrexed Disodium",
                "Ramucirumab",
                "Sotorasib",
                "Tagrisso (Osimertinib Mesylate)",
                "Tarceva (Erlotinib Hydrochloride)",
                "Taxotere (Docetaxel)",
                "Tecentriq (Atezolizumab)",
                "Vinorelbine Tartrate",
                "Xalkori (Crizotinib)",
                "Yervoy (Ipilimumab)",
                "Zykadia (Ceritinib)"
            ],
            "TP": 20,
            "FP": 4,
            "FN": 0
        }
    },
    {
        "test": "limited-list-referents",
        "responder": "anthropic.claude-3-5-sonnet-v1:0",
        "concept": "approved drug for lung cancer",
        "domain": "medicine",
        "response": [
            "Cisplatin (CDDP)",
            "Carboplatin",
            "Paclitaxel (Taxol)",
            "Docetaxel (Taxotere)",
            "Gemcitabine (Gemzar)",
            "Pemetrexed (Alimta)",
            "Erlotinib (Tarceva)",
            "Gefitinib (Iressa)",
            "Afatinib (Gilotrif)",
            "Osimertinib (Tagrisso)",
            "Crizotinib (Xalkori)",
            "Alectinib (Alecensa)",
            "Ceritinib (Zykadia)",
            "Brigatinib (Alunbrig)",
            "Lorlatinib (Lorbrena)",
            "Pembrolizumab (Keytruda)",
            "Nivolumab (Opdivo)",
            "Atezolizumab (Tecentriq)",
            "Durvalumab (Imfinzi)",
            "Ramucirumab (Cyramza)",
            "Bevacizumab (Avastin)",
            "Necitumumab (Portrazza)",
            "Dabrafenib (Tafinlar)",
            "Trametinib (Mekinist)"
        ],
        "scorer": "gpt-4o",
        "judgement": {
            "matches": [
                "Docetaxel (Taxotere)",
                "Gemcitabine (Gemzar)",
                "Pemetrexed (Alimta)",
                "Erlotinib (Tarceva)",
                "Gefitinib (Iressa)",
                "Afatinib (Gilotrif)",
                "Osimertinib (Tagrisso)",
                "Crizotinib (Xalkori)",
                "Alectinib (Alecensa)",
                "Ceritinib (Zykadia)",
                "Brigatinib (Alunbrig)",
                "Lorlatinib (Lorbrena)",
                "Pembrolizumab (Keytruda)",
                "Nivolumab (Opdivo)",
                "Atezolizumab (Tecentriq)",
                "Durvalumab (Imfinzi)",
                "Ramucirumab (Cyramza)",
                "Bevacizumab (Avastin)",
                "Necitumumab (Portrazza)",
                "Dabrafenib (Tafinlar)",
                "Trametinib (Mekinist)"
            ],
            "mismatches": [
                "Cisplatin (CDDP)",
                "Carboplatin",
                "Paclitaxel (Taxol)"
            ],
            "true_referents": [
                "Alecensa (Alectinib)",
                "Alectinib",
                "Alimta (Pemetrexed Disodium)",
                "Alunbrig (Brigatinib)",
                "Alymsys (Bevacizumab)",
                "Atezolizumab",
                "Avastin (Bevacizumab)",
                "Bevacizumab",
                "Binimetinib",
                "Brigatinib",
                "Ceritinib",
                "Crizotinib",
                "Cyramza (Ramucirumab)",
                "Dabrafenib Mesylate",
                "Docetaxel",
                "Durvalumab",
                "Erlotinib Hydrochloride",
                "Gefitinib",
                "Gemcitabine Hydrochloride",
                "Gemzar (Gemcitabine Hydrochloride)",
                "Gilotrif (Afatinib Dimaleate)",
                "Imfinzi (Durvalumab)",
                "Infugem (Gemcitabine Hydrochloride)",
                "Iressa (Gefitinib)",
                "Keytruda (Pembrolizumab)",
                "Lorbrena (Lorlatinib)",
                "Lorlatinib",
                "Mekinist (Trametinib Dimethyl Sulfoxide)",
                "Necitumumab",
                "Nivolumab",
                "Opdivo (Nivolumab)",
                "Osimertinib Mesylate",
                "Paclitaxel",
                "Pembrolizumab",
                "Pemetrexed Disodium",
                "Portrazza (Necitumumab)",
                "Ramucirumab",
                "Tafinlar (Dabrafenib Mesylate)",
                "Tagrisso (Osimertinib Mesylate)",
                "Tarceva (Erlotinib Hydrochloride)",
                "Taxotere (Docetaxel)",
                "Tecentriq (Atezolizumab)",
                "Trametinib Dimethyl Sulfoxide",
                "Xalkori (Crizotinib)",
                "Zykadia (Ceritinib)"
            ],
            "TP": 21,
            "FP": 3,
            "FN": 0
        }
    },
    {
        "test": "limited-list-referents",
        "responder": "anthropic.claude-3-opus-v1:0",
        "concept": "approved drug for lung cancer",
        "domain": "medicine",
        "response": [
            "Osimertinib (Tagrisso)",
            "Crizotinib (Xalkori)",
            "Alectinib (Alecensa)",
            "Ceritinib (Zykadia)",
            "Brigatinib (Alunbrig)",
            "Lorlatinib (Lorbrena)",
            "Gefitinib (Iressa)",
            "Erlotinib (Tarceva)",
            "Afatinib (Gilotrif)",
            "Dacomitinib (Vizimpro)",
            "Bevacizumab (Avastin)",
            "Ramucirumab (Cyramza)",
            "Nivolumab (Opdivo)",
            "Pembrolizumab (Keytruda)",
            "Atezolizumab (Tecentriq)",
            "Durvalumab (Imfinzi)",
            "Ipilimumab (Yervoy)",
            "Necitumumab (Portrazza)",
            "Docetaxel (Taxotere)",
            "Paclitaxel (Taxol)",
            "Pemetrexed (Alimta)",
            "Gemcitabine (Gemzar)",
            "Vinorelbine (Navelbine)",
            "Etoposide (Etopophos)"
        ],
        "scorer": "gpt-4o",
        "judgement": {
            "matches": [
                "Crizotinib (Xalkori)",
                "Alectinib (Alecensa)",
                "Ceritinib (Zykadia)",
                "Brigatinib (Alunbrig)",
                "Lorlatinib (Lorbrena)",
                "Gefitinib (Iressa)",
                "Dacomitinib (Vizimpro)",
                "Bevacizumab (Avastin)",
                "Ramucirumab (Cyramza)",
                "Nivolumab (Opdivo)",
                "Pembrolizumab (Keytruda)",
                "Atezolizumab (Tecentriq)",
                "Durvalumab (Imfinzi)",
                "Ipilimumab (Yervoy)",
                "Necitumumab (Portrazza)",
                "Docetaxel (Taxotere)"
            ],
            "mismatches": [
                "Osimertinib (Tagrisso)",
                "Erlotinib (Tarceva)",
                "Afatinib (Gilotrif)",
                "Pemetrexed (Alimta)",
                "Gemcitabine (Gemzar)",
                "Vinorelbine (Navelbine)",
                "Etoposide (Etopophos)",
                "Paclitaxel (Taxol)"
            ],
            "true_referents": [
                "Alecensa (Alectinib)",
                "Alectinib",
                "Alimta (Pemetrexed Disodium)",
                "Alunbrig (Brigatinib)",
                "Alymsys (Bevacizumab)",
                "Atezolizumab",
                "Avastin (Bevacizumab)",
                "Bevacizumab",
                "Binimetinib",
                "Brigatinib",
                "Ceritinib",
                "Crizotinib",
                "Cyramza (Ramucirumab)",
                "Dacomitinib",
                "Docetaxel",
                "Durvalumab",
                "Erlotinib Hydrochloride",
                "Etopophos (Etoposide Phosphate)",
                "Etoposide",
                "Etoposide Phosphate",
                "Gefitinib",
                "Gemcitabine Hydrochloride",
                "Gemzar (Gemcitabine Hydrochloride)",
                "Gilotrif (Afatinib Dimaleate)",
                "Imfinzi (Durvalumab)",
                "Infugem (Gemcitabine Hydrochloride)",
                "Ipilimumab",
                "Iressa (Gefitinib)",
                "Keytruda (Pembrolizumab)",
                "Lorbrena (Lorlatinib)",
                "Lorlatinib",
                "Necitumumab",
                "Nivolumab",
                "Opdivo (Nivolumab)",
                "Osimertinib Mesylate",
                "Paclitaxel",
                "Pembrolizumab",
                "Pemetrexed Disodium",
                "Portrazza (Necitumumab)",
                "Ramucirumab",
                "Tagrisso (Osimertinib Mesylate)",
                "Tarceva (Erlotinib Hydrochloride)",
                "Taxotere (Docetaxel)",
                "Tecentriq (Atezolizumab)",
                "Vinorelbine Tartrate",
                "Vizimpro (Dacomitinib)",
                "Xalkori (Crizotinib)",
                "Yervoy (Ipilimumab)",
                "Zykadia (Ceritinib)"
            ],
            "TP": 16,
            "FP": 8,
            "FN": 0
        }
    },
    {
        "test": "limited-list-referents",
        "responder": "anthropic.claude-3-sonnet-v1:0",
        "concept": "approved drug for lung cancer",
        "domain": "medicine",
        "response": [
            "Gefitinib (Iressa)",
            "Erlotinib (Tarceva)",
            "Afatinib (Gilotrif)",
            "Osimertinib (Tagrisso)",
            "Crizotinib (Xalkori)",
            "Ceritinib (Zykadia)",
            "Alectinib (Alecensa)",
            "Brigatinib (Alunbrig)",
            "Lorlatinib (Lorviqua)",
            "Dabrafenib (Tafinlar) + Trametinib (Mekinist)",
            "Nivolumab (Opdivo)",
            "Pembrolizumab (Keytruda)",
            "Atezolizumab (Tecentriq)",
            "Durvalumab (Imfinzi)",
            "Ramucirumab (Cyramza)",
            "Necitumumab (Portrazza)",
            "Pemetrexed (Alimta)",
            "Gemcitabine (Gemzar)",
            "Docetaxel (Taxotere)",
            "Paclitaxel (Taxol)",
            "Vinorelbine (Navelbine)",
            "Etoposide (Vepesid)",
            "Cisplatin (Platinol)",
            "Carboplatin (Paraplatin)"
        ],
        "scorer": "gpt-4o",
        "judgement": {
            "matches": [
                "Gefitinib (Iressa)",
                "Erlotinib (Tarceva)",
                "Afatinib (Gilotrif)",
                "Osimertinib (Tagrisso)",
                "Crizotinib (Xalkori)",
                "Ceritinib (Zykadia)",
                "Alectinib (Alecensa)",
                "Brigatinib (Alunbrig)",
                "Nivolumab (Opdivo)",
                "Pembrolizumab (Keytruda)",
                "Atezolizumab (Tecentriq)",
                "Durvalumab (Imfinzi)",
                "Ramucirumab (Cyramza)",
                "Necitumumab (Portrazza)",
                "Pemetrexed (Alimta)",
                "Gemcitabine (Gemzar)",
                "Docetaxel (Taxotere)"
            ],
            "mismatches": [
                "Lorlatinib (Lorviqua)",
                "Dabrafenib (Tafinlar) + Trametinib (Mekinist)",
                "Paclitaxel (Taxol)",
                "Vinorelbine (Navelbine)",
                "Etoposide (Vepesid)",
                "Cisplatin (Platinol)",
                "Carboplatin (Paraplatin)"
            ],
            "true_referents": [
                "Alecensa (Alectinib)",
                "Alectinib",
                "Alimta (Pemetrexed Disodium)",
                "Alunbrig (Brigatinib)",
                "Atezolizumab",
                "Binimetinib",
                "Brigatinib",
                "Ceritinib",
                "Crizotinib",
                "Cyramza (Ramucirumab)",
                "Dabrafenib Mesylate",
                "Docetaxel",
                "Durvalumab",
                "Erlotinib Hydrochloride",
                "Etopophos (Etoposide Phosphate)",
                "Etoposide",
                "Etoposide Phosphate",
                "Gefitinib",
                "Gemcitabine Hydrochloride",
                "Gemzar (Gemcitabine Hydrochloride)",
                "Gilotrif (Afatinib Dimaleate)",
                "Imfinzi (Durvalumab)",
                "Infugem (Gemcitabine Hydrochloride)",
                "Iressa (Gefitinib)",
                "Keytruda (Pembrolizumab)",
                "Lorbrena (Lorlatinib)",
                "Lorlatinib",
                "Mekinist (Trametinib Dimethyl Sulfoxide)",
                "Necitumumab",
                "Nivolumab",
                "Opdivo (Nivolumab)",
                "Osimertinib Mesylate",
                "Paclitaxel",
                "Pembrolizumab",
                "Pemetrexed Disodium",
                "Portrazza (Necitumumab)",
                "Ramucirumab",
                "Tafinlar (Dabrafenib Mesylate)",
                "Tagrisso (Osimertinib Mesylate)",
                "Tarceva (Erlotinib Hydrochloride)",
                "Taxotere (Docetaxel)",
                "Tecentriq (Atezolizumab)",
                "Vinorelbine Tartrate",
                "Xalkori (Crizotinib)",
                "Zykadia (Ceritinib)"
            ],
            "TP": 17,
            "FP": 7,
            "FN": 0
        }
    },
    {
        "test": "limited-list-referents",
        "responder": "anthropic.claude-3-haiku-v1:0",
        "concept": "approved drug for lung cancer",
        "domain": "medicine",
        "response": [
            "Alectinib (ALC)",
            "Atezolizumab (ATE)",
            "Brigatinib (BRI)",
            "Cabozantinib (CAB)",
            "Ceritinib (CER)",
            "Crizotinib (CRI)",
            "Dacomitinib (DAC)",
            "Durvalumab (DUR)",
            "Erlotinib (ERL)",
            "Gefitinib (GEF)",
            "Lorlatinib (LOR)",
            "Necitumumab (NEC)",
            "Nivolumab (NIV)",
            "Osimertinib (OSI)",
            "Pembrolizumab (PEM)",
            "Ramucirumab (RAM)",
            "Selpercatinib (SEL)",
            "Tepotinib (TEP)",
            "Tislelizumab (TIS)",
            "Trametinib (TRA)",
            "Vandetanib (VAN)",
            "Vemurafenib (VEM)",
            "Vinorelbine (VIN)",
            "Zanubrutinib (ZAN)"
        ],
        "scorer": "gpt-4o",
        "judgement": {
            "matches": [
                "Alectinib",
                "Atezolizumab",
                "Brigatinib",
                "Ceritinib",
                "Crizotinib",
                "Dacomitinib",
                "Durvalumab",
                "Gefitinib",
                "Lorlatinib",
                "Necitumumab",
                "Nivolumab",
                "Osimertinib Mesylate",
                "Pembrolizumab",
                "Ramucirumab",
                "Selpercatinib",
                "Tepotinib Hydrochloride"
            ],
            "mismatches": [
                "Cabozantinib (CAB)",
                "Erlotinib (ERL)",
                "Tislelizumab (TIS)",
                "Trametinib (TRA)",
                "Vandetanib (VAN)",
                "Vemurafenib (VEM)",
                "Vinorelbine (VIN)",
                "Zanubrutinib (ZAN)"
            ],
            "true_referents": [
                "Alecensa (Alectinib)",
                "Alectinib",
                "Alunbrig (Brigatinib)",
                "Atezolizumab",
                "Avastin (Bevacizumab)",
                "Bevacizumab",
                "Binimetinib",
                "Brigatinib",
                "Ceritinib",
                "Crizotinib",
                "Cyramza (Ramucirumab)",
                "Dacomitinib",
                "Durvalumab",
                "Erlotinib Hydrochloride",
                "Gefitinib",
                "Imfinzi (Durvalumab)",
                "Iressa (Gefitinib)",
                "Keytruda (Pembrolizumab)",
                "Lorbrena (Lorlatinib)",
                "Lorlatinib",
                "Necitumumab",
                "Nivolumab",
                "Opdivo (Nivolumab)",
                "Osimertinib Mesylate",
                "Paclitaxel",
                "Pembrolizumab",
                "Portrazza (Necitumumab)",
                "Pralsetinib",
                "Ramucirumab",
                "Retevmo (Selpercatinib)",
                "Selpercatinib",
                "Tagrisso (Osimertinib Mesylate)",
                "Tarceva (Erlotinib Hydrochloride)",
                "Taxotere (Docetaxel)",
                "Tecentriq (Atezolizumab)",
                "Tepmetko (Tepotinib Hydrochloride)",
                "Tepotinib Hydrochloride",
                "Vinorelbine Tartrate",
                "Vizimpro (Dacomitinib)",
                "Xalkori (Crizotinib)",
                "Zenocutuzumab-zbco"
            ],
            "TP": 16,
            "FP": 8,
            "FN": 0
        }
    },
    {
        "test": "limited-list-referents",
        "responder": "meta.llama3-8b-instruct-v1:0",
        "concept": "approved drug for lung cancer",
        "domain": "medicine",
        "response": [
            "Afatinib (Gilotrif)",
            "Alectinib (Alecensa)",
            "Alimta (Pemetrexed)",
            "Alectinib (Naked-PC)",
            "Atezolizumab (Tecentriq)",
            "Bevacizumab (Avastin)",
            "Bortezomib (Velcade)",
            "Carboplatin",
            "Carfilzomib (Kyprolis)",
            "Cetuximab (Erbitux)",
            "Crizotinib (Xalkori)",
            "Cytarabine (Cytoxan)",
            "Dabrafenib (Tafinlar)",
            "Durvalumab (Imfinzi)",
            "Erlotinib (Tarceva)",
            "Everolimus (Afinitor)",
            "Gemcitabine (Gemzar)",
            "Imatinib (Gleevec)",
            "Irinotecan (Camptosar)",
            "Lapatinib (Tykerb)",
            "Nivolumab (Opdivo)",
            "Osimertinib (Tagrisso)",
            "Pemetrexed (Alimta)",
            "Pembrolizumab (Keytruda)",
            "Rituximab (Rituxan)",
            "Sorafenib (Nexavar)",
            "Temozolomide (Temodar)",
            "Trastuzumab (Herceptin)"
        ],
        "scorer": "gpt-4o",
        "judgement": {
            "matches": [
                "Alectinib (Alecensa)",
                "Atezolizumab (Tecentriq)",
                "Bevacizumab (Avastin)",
                "Crizotinib (Xalkori)",
                "Dabrafenib (Tafinlar)",
                "Durvalumab (Imfinzi)",
                "Erlotinib (Tarceva)",
                "Everolimus (Afinitor)",
                "Gemcitabine (Gemzar)",
                "Nivolumab (Opdivo)",
                "Osimertinib (Tagrisso)",
                "Pemetrexed (Alimta)",
                "Pembrolizumab (Keytruda)"
            ],
            "mismatches": [
                "Afatinib (Gilotrif)",
                "Alectinib (Naked-PC)",
                "Bortezomib (Velcade)",
                "Carboplatin",
                "Carfilzomib (Kyprolis)",
                "Cetuximab (Erbitux)",
                "Cytarabine (Cytoxan)",
                "Imatinib (Gleevec)",
                "Irinotecan (Camptosar)",
                "Lapatinib (Tykerb)",
                "Rituximab (Rituxan)",
                "Sorafenib (Nexavar)",
                "Temozolomide (Temodar)",
                "Trastuzumab (Herceptin)"
            ],
            "true_referents": [
                "Afinitor (Everolimus)",
                "Alecensa (Alectinib)",
                "Alectinib",
                "Alimta (Pemetrexed Disodium)",
                "Alymsys (Bevacizumab)",
                "Atezolizumab",
                "Avastin (Bevacizumab)",
                "Bevacizumab",
                "Binimetinib",
                "Brigatinib",
                "Ceritinib",
                "Crizotinib",
                "Dabrafenib Mesylate",
                "Docetaxel",
                "Durvalumab",
                "Erlotinib Hydrochloride",
                "Everolimus",
                "Fam-Trastuzumab Deruxtecan-nxki",
                "Gefitinib",
                "Gemcitabine Hydrochloride",
                "Gemzar (Gemcitabine Hydrochloride)",
                "Gilotrif (Afatinib Dimaleate)",
                "Imfinzi (Durvalumab)",
                "Infugem (Gemcitabine Hydrochloride)",
                "Keytruda (Pembrolizumab)",
                "Lorbrena (Lorlatinib)",
                "Nivolumab",
                "Opdivo (Nivolumab)",
                "Osimertinib Mesylate",
                "Paclitaxel",
                "Pembrolizumab",
                "Pemetrexed Disodium",
                "Tafinlar (Dabrafenib Mesylate)",
                "Tagrisso (Osimertinib Mesylate)",
                "Tarceva (Erlotinib Hydrochloride)",
                "Taxotere (Docetaxel)",
                "Tecentriq (Atezolizumab)",
                "Xalkori (Crizotinib)"
            ],
            "TP": 13,
            "FP": 14,
            "FN": 0
        }
    },
    {
        "test": "limited-list-referents",
        "responder": "meta.llama3-70b-instruct-v1:0",
        "concept": "approved drug for lung cancer",
        "domain": "medicine",
        "response": [
            "Afatinib (Gilotrif)",
            "Alectinib (Alecensa)",
            "Atezolizumab (Tecentriq)",
            "Bevacizumab (Avastin)",
            "Binimetinib (Mektovi)",
            "Brigatinib (Alunbrig)",
            "Cabozantinib (Cabometyx)",
            "Crizotinib (Xalkori)",
            "Dabrafenib (Tafinlar)",
            "Durvalumab (Imfinzi)",
            "Encorafenib (Braftovi)",
            "Erlotinib (Tarceva)",
            " Gefitinib (Iressa)",
            "Ivosidenib (Tibsovo)",
            "Necitumumab (Portrazza)",
            "Nivolumab (Opdivo)",
            "Osimertinib (Tagrisso)",
            "Pazopanib (Votrient)",
            "Pembrolizumab (Keytruda)",
            "Ramucirumab (Cyramza)",
            "Ripretinib ( Qinlock)",
            "Selpercatinib (Retsevmo)",
            "Sorafenib (Nexavar)",
            "Trametinib (Mekinist)"
        ],
        "scorer": "gpt-4o",
        "judgement": {
            "matches": [
                "Alectinib (Alecensa)",
                "Atezolizumab (Tecentriq)",
                "Bevacizumab (Avastin)",
                "Binimetinib (Mektovi)",
                "Brigatinib (Alunbrig)",
                "Crizotinib (Xalkori)",
                "Dabrafenib (Tafinlar)",
                "Durvalumab (Imfinzi)",
                "Encorafenib (Braftovi)",
                "Gefitinib (Iressa)",
                "Necitumumab (Portrazza)",
                "Nivolumab (Opdivo)",
                "Osimertinib (Tagrisso)",
                "Pembrolizumab (Keytruda)",
                "Ramucirumab (Cyramza)",
                "Selpercatinib (Retsevmo)",
                "Trametinib (Mekinist)"
            ],
            "mismatches": [
                "Afatinib (Gilotrif)",
                "Cabozantinib (Cabometyx)",
                "Erlotinib (Tarceva)",
                "Ivosidenib (Tibsovo)",
                "Pazopanib (Votrient)",
                "Ripretinib (Qinlock)",
                "Sorafenib (Nexavar)"
            ],
            "true_referents": [
                "Alecensa (Alectinib)",
                "Alectinib",
                "Alunbrig (Brigatinib)",
                "Alymsys (Bevacizumab)",
                "Atezolizumab",
                "Avastin (Bevacizumab)",
                "Bevacizumab",
                "Binimetinib",
                "Braftovi (Encorafenib)",
                "Brigatinib",
                "Ceritinib",
                "Crizotinib",
                "Cyramza (Ramucirumab)",
                "Dabrafenib Mesylate",
                "Dacomitinib",
                "Durvalumab",
                "Encorafenib",
                "Erlotinib Hydrochloride",
                "Gefitinib",
                "Gilotrif (Afatinib Dimaleate)",
                "Imfinzi (Durvalumab)",
                "Iressa (Gefitinib)",
                "Keytruda (Pembrolizumab)",
                "Lorbrena (Lorlatinib)",
                "Mekinist (Trametinib Dimethyl Sulfoxide)",
                "Mektovi (Binimetinib)",
                "Necitumumab",
                "Nivolumab",
                "Opdivo (Nivolumab)",
                "Osimertinib Mesylate",
                "Pembrolizumab",
                "Portrazza (Necitumumab)",
                "Ramucirumab",
                "Repotrectinib",
                "Retevmo (Selpercatinib)",
                "Selpercatinib",
                "Tabrecta (Capmatinib Hydrochloride)",
                "Tafinlar (Dabrafenib Mesylate)",
                "Tagrisso (Osimertinib Mesylate)",
                "Tarceva (Erlotinib Hydrochloride)",
                "Tecentriq (Atezolizumab)",
                "Tepmetko (Tepotinib Hydrochloride)",
                "Trametinib Dimethyl Sulfoxide",
                "Vizimpro (Dacomitinib)",
                "Xalkori (Crizotinib)"
            ],
            "TP": 17,
            "FP": 7,
            "FN": 0
        }
    },
    {
        "test": "limited-list-referents",
        "responder": "amazon.titan-text-express-v1",
        "concept": "approved drug for lung cancer",
        "domain": "medicine",
        "response": [
            {
                "Referent": "Alectinib (RO5424038)",
                "Canonical name": "Alectinib"
            },
            {
                "Referent": "Apatinib (HY-102111)",
                "Canonical name": "Apatinib"
            },
            {
                "Referent": "Crizotinib (PF-02341066)",
                "Canonical name": "Crizotinib"
            },
            {
                "Referent": "Erlotinib (OSI-774)",
                "Canonical name": "Erlotinib"
            },
            {
                "Referent": "Gefitinib (ZD1839)",
                "Canonical name": "Gefitinib"
            },
            {
                "Referent": "Icotinib (CP-600401)",
                "Canonical name": "Icotinib"
            },
            {
                "Referent": "Nintedanib (BIBF 1120)",
                "Canonical name": "Nintedanib"
            },
            {
                "Referent": "Osimertinib (AZD9291)",
                "Canonical name": "Osimertinib"
            },
            {
                "Referent": "Pazopanib (Votrient)",
                "Canonical name": "Pazopanib"
            },
            {
                "Referent": "Ramucirumab (Cyramza)",
                "Canonical name": "Ramucirumab"
            },
            {
                "Referent": "Ribociclib (LEE011)",
                "Canonical name": "Ribociclib"
            },
            {
                "Referent": "Ruxolitinib (INCB018424)",
                "Canonical name": "Ruxolitinib"
            },
            {
                "Referent": "Sorafenib (Nexavar)",
                "Canonical name": "Sorafenib"
            },
            {
                "Referent": "Trametinib (GSK1120212)",
                "Canonical name": "Trametinib"
            },
            {
                "Referent": "Vandetanib (ZD6474)",
                "Canonical name": "Vandetanib"
            },
            {
                "Referent": "Vismodegib (GDC-0449)",
                "Canonical name": "Vismodegib"
            },
            {
                "Referent": "Ziv-aflibercept (Zaltrap)",
                "Canonical name": "Ziv-aflibercept"
            }
        ],
        "scorer": "gpt-4o",
        "judgement": {
            "matches": [
                "Alectinib",
                "Crizotinib",
                "Gefitinib",
                "Ramucirumab"
            ],
            "mismatches": [
                "Apatinib",
                "Erlotinib",
                "Icotinib",
                "Nintedanib",
                "Osimertinib",
                "Pazopanib",
                "Ribociclib",
                "Ruxolitinib",
                "Sorafenib",
                "Trametinib",
                "Vandetanib",
                "Vismodegib",
                "Ziv-aflibercept"
            ],
            "true_referents": [
                "Alecensa (Alectinib)",
                "Alectinib",
                "Avastin (Bevacizumab)",
                "Bevacizumab",
                "Binimetinib",
                "Bizengri (Zenocutuzumab-zbco)",
                "Ceritinib",
                "Crizotinib",
                "Cyramza (Ramucirumab)",
                "Entrectinib",
                "Gefitinib",
                "Iressa (Gefitinib)",
                "Keytruda (Pembrolizumab)",
                "Libtayo (Cemiplimab-rwlc)",
                "Osimertinib Mesylate",
                "Pralsetinib",
                "Ramucirumab",
                "Zenocutuzumab-zbco"
            ],
            "TP": 4,
            "FP": 13,
            "FN": 0
        }
    }
]