[
    {
        "test": "limited-list-referents-from-selection-criteria",
        "responder": "qwen-v2.5-14b-instruct",
        "concept": "approved drug for colorectal cancer",
        "domain": "medicine",
        "response": [
            "Cetuximab (C225)",
            "Bevacizumab (Avastin)",
            "Panitumumab (Vectibix)",
            "Regorafenib (Stivarga)",
            "Trifluridine/tipiracil (Lonsurf)",
            "Irinotecan (Camptosar)",
            "Folfox (5-Fluorouracil, Leucovorin, Oxaliplatin)",
            "Folfiri (5-Fluorouracil, Leucovorin, Irinotecan)",
            "Capecitabine (Xeloda)",
            "Oxaliplatin (Eloxatin)",
            "Raltitrexed (Tomudex)",
            "Uft (Uracil/Tegafur)",
            "Tegafur (Adrucil)",
            "Leucovorin (Folotyn)",
            "Nalurapeptide (Aflibercept)",
            "Ziv-aflibercept (Zaltrap)",
            "Nab-paclitaxel (Abraxane)",
            "Ramucirumab (Cyramza)",
            "TAS-102 (Lonsurf)",
            "Fam-trastuzumab deruxtecan (Enhertu)",
            "Apatinib (Yivday)",
            "Nintedanib (Ofev)",
            "Trametinib (Mekinist)"
        ],
        "scorer": "gpt-4o",
        "judgement": {
            "matches": [
                "Cetuximab (C225)",
                "Bevacizumab (Avastin)",
                "Panitumumab (Vectibix)",
                "Regorafenib (Stivarga)",
                "Trifluridine/tipiracil (Lonsurf)",
                "Irinotecan (Camptosar)",
                "Folfox (5-Fluorouracil, Leucovorin, Oxaliplatin)",
                "Folfiri (5-Fluorouracil, Leucovorin, Irinotecan)",
                "Capecitabine (Xeloda)",
                "Oxaliplatin (Eloxatin)",
                "Raltitrexed (Tomudex)",
                "Uft (Uracil/Tegafur)",
                "Tegafur (Adrucil)",
                "Leucovorin (Folotyn)",
                "Ziv-aflibercept (Zaltrap)",
                "Nab-paclitaxel (Abraxane)",
                "Ramucirumab (Cyramza)",
                "TAS-102 (Lonsurf)",
                "Fam-trastuzumab deruxtecan (Enhertu)",
                "Apatinib (Yivday)",
                "Nintedanib (Ofev)",
                "Trametinib (Mekinist)"
            ],
            "mismatches": [
                "Nalurapeptide (Aflibercept)"
            ],
            "true_referents": [
                "Apatinib (Yivday)",
                "Bevacizumab (Avastin)",
                "Capecitabine (Xeloda)",
                "Cetuximab (C225)",
                "Fam-trastuzumab deruxtecan (Enhertu)",
                "Folfiri (5-Fluorouracil, Leucovorin, Irinotecan)",
                "Folfox (5-Fluorouracil, Leucovorin, Oxaliplatin)",
                "Irinotecan (Camptosar)",
                "Leucovorin (Folotyn)",
                "Nab-paclitaxel (Abraxane)",
                "Nalurapeptide (Aflibercept)",
                "Nintedanib (Ofev)",
                "Oxaliplatin (Eloxatin)",
                "Panitumumab (Vectibix)",
                "Raltitrexed (Tomudex)",
                "Ramucirumab (Cyramza)",
                "Regorafenib (Stivarga)",
                "TAS-102 (Lonsurf)",
                "Tegafur (Adrucil)",
                "Trametinib (Mekinist)",
                "Trifluridine/tipiracil (Lonsurf)",
                "Uft (Uracil/Tegafur)",
                "Ziv-aflibercept (Zaltrap)"
            ],
            "TP": 22,
            "FP": 1,
            "FN": 0
        }
    },
    {
        "test": "limited-list-referents-from-selection-criteria",
        "responder": "phi-v4",
        "concept": "approved drug for colorectal cancer",
        "domain": "medicine",
        "response": [
            "Bevacizumab (Avastin)",
            "Cetuximab (Erbitux)",
            "Panitumumab (Vectibix)",
            "Olaparib (Lynparza)",
            "Rucaparib (Rubraca)",
            "Niraparib (Zejula)",
            "Pembrolizumab (Keytruda)",
            "Atezolizumab (Tecentriq)",
            "Ipilimumab (Yervoy)",
            "Nivolumab (Opdivo)",
            "Regorafenib (Stivarga)",
            "Trifluridine/Tipiracil (Lonsurf)",
            "Cape Oligonucleotide (Avastin)",
            "Dabrafenib (Tafinlar)",
            "Trametinib (Mekinist)",
            "Encorafenib (Braftovi)",
            "Vemurafenib (Zelboraf)",
            "Lapatinib (Tykerb)",
            "Sorafenib (Nexavar)",
            "Sunitinib (Sutent)",
            "Everolimus (Afinitor)",
            "Temsirolimus (Torisel)",
            "Pazopanib (Votrient)",
            "Sorafenib (BAY 43-9006)"
        ],
        "scorer": "gpt-4o",
        "judgement": {
            "matches": [
                "Bevacizumab (Avastin)",
                "Cetuximab (Erbitux)",
                "Panitumumab (Vectibix)",
                "Olaparib (Lynparza)",
                "Rucaparib (Rubraca)",
                "Niraparib (Zejula)",
                "Pembrolizumab (Keytruda)",
                "Atezolizumab (Tecentriq)",
                "Ipilimumab (Yervoy)",
                "Nivolumab (Opdivo)",
                "Regorafenib (Stivarga)",
                "Trifluridine/Tipiracil (Lonsurf)",
                "Cape Oligonucleotide (Avastin)",
                "Dabrafenib (Tafinlar)",
                "Trametinib (Mekinist)",
                "Encorafenib (Braftovi)",
                "Vemurafenib (Zelboraf)",
                "Lapatinib (Tykerb)",
                "Sorafenib (Nexavar)",
                "Sunitinib (Sutent)",
                "Everolimus (Afinitor)",
                "Temsirolimus (Torisel)",
                "Pazopanib (Votrient)",
                "Sorafenib (BAY 43-9006)"
            ],
            "mismatches": [],
            "true_referents": [
                "Atezolizumab (Tecentriq)",
                "Bevacizumab (Avastin)",
                "Cape Oligonucleotide (Avastin)",
                "Cetuximab (Erbitux)",
                "Dabrafenib (Tafinlar)",
                "Encorafenib (Braftovi)",
                "Everolimus (Afinitor)",
                "Ipilimumab (Yervoy)",
                "Lapatinib (Tykerb)",
                "Niraparib (Zejula)",
                "Nivolumab (Opdivo)",
                "Olaparib (Lynparza)",
                "Panitumumab (Vectibix)",
                "Pazopanib (Votrient)",
                "Pembrolizumab (Keytruda)",
                "Regorafenib (Stivarga)",
                "Rucaparib (Rubraca)",
                "Sorafenib (BAY 43-9006)",
                "Sorafenib (Nexavar)",
                "Sunitinib (Sutent)",
                "Temsirolimus (Torisel)",
                "Trametinib (Mekinist)",
                "Trifluridine/Tipiracil (Lonsurf)",
                "Vemurafenib (Zelboraf)"
            ],
            "TP": 24,
            "FP": 0,
            "FN": 0
        }
    },
    {
        "test": "limited-list-referents-from-selection-criteria",
        "responder": "mistral-small-instruct-24B",
        "concept": "approved drug for colorectal cancer",
        "domain": "medicine",
        "response": [
            "5-Fluorouracil (5-FU)",
            "Capecitabine (Xeloda)",
            "Oxaliplatin (Eloxatin)",
            "Irinotecan (Camptosar)",
            "Leucovorin",
            "FOLFOX",
            "FOLFIRI",
            "Pemetrexed (Alimta)",
            "Bevacizumab (Avastin)",
            "Cetuximab (Erbitux)",
            "Panitumumab (Vectibix)",
            "Regorafenib (Stivarga)",
            "Ziv-aflibercept (Zaltrap)",
            "Ramucirumab (Cyramza)",
            "Trifluridine/Tipiracil (Lonsurf)",
            "Apatinib",
            "Nivolumab (Opdivo)",
            "Pembrolizumab (Keytruda)",
            "Durvalumab (Imfinzi)",
            "Atezolizumab (Tecentriq)",
            "Encorafenib (Braftovi)",
            "Binimetinib (Mektovi)",
            "Lenvatinib (Lenvima)",
            "Fruquintinib"
        ],
        "scorer": "gpt-4o",
        "judgement": {
            "matches": [
                "5-Fluorouracil (5-FU)",
                "Capecitabine (Xeloda)",
                "Oxaliplatin (Eloxatin)",
                "Irinotecan (Camptosar)",
                "Leucovorin",
                "FOLFOX",
                "FOLFIRI",
                "Pemetrexed (Alimta)",
                "Bevacizumab (Avastin)",
                "Cetuximab (Erbitux)",
                "Panitumumab (Vectibix)",
                "Regorafenib (Stivarga)",
                "Ziv-aflibercept (Zaltrap)",
                "Ramucirumab (Cyramza)",
                "Trifluridine/Tipiracil (Lonsurf)",
                "Apatinib",
                "Nivolumab (Opdivo)",
                "Pembrolizumab (Keytruda)",
                "Durvalumab (Imfinzi)",
                "Atezolizumab (Tecentriq)",
                "Encorafenib (Braftovi)",
                "Binimetinib (Mektovi)",
                "Lenvatinib (Lenvima)",
                "Fruquintinib"
            ],
            "mismatches": [],
            "true_referents": [
                "5-Fluorouracil (5-FU)",
                "Apatinib",
                "Atezolizumab (Tecentriq)",
                "Bevacizumab (Avastin)",
                "Binimetinib (Mektovi)",
                "Capecitabine (Xeloda)",
                "Cetuximab (Erbitux)",
                "Durvalumab (Imfinzi)",
                "Encorafenib (Braftovi)",
                "FOLFIRI",
                "FOLFOX",
                "Fruquintinib",
                "Irinotecan (Camptosar)",
                "Lenvatinib (Lenvima)",
                "Leucovorin",
                "Nivolumab (Opdivo)",
                "Oxaliplatin (Eloxatin)",
                "Panitumumab (Vectibix)",
                "Pembrolizumab (Keytruda)",
                "Pemetrexed (Alimta)",
                "Ramucirumab (Cyramza)",
                "Regorafenib (Stivarga)",
                "Trifluridine/Tipiracil (Lonsurf)",
                "Ziv-aflibercept (Zaltrap)"
            ],
            "TP": 24,
            "FP": 0,
            "FN": 0
        }
    },
    {
        "test": "limited-list-referents-from-selection-criteria",
        "responder": "gemma-3",
        "concept": "approved drug for colorectal cancer",
        "domain": "medicine",
        "response": [
            "5-Fluorouracil (5-FU)",
            "Capecitabine (CAP)",
            "Oxaliplatin (OXA)",
            "Irinotecan (IRI)",
            "Bevacizumab (BEV)",
            "Cetuximab (CTX)",
            "Panitumumab (PAN)",
            "Regorafenib (REG)",
            "Zivafibine (ZIV)",
            "Trifluridine/Tipiracil (LONSURF)",
            "Ramucirumab (RAM)",
            "Folinic Acid (FA)",
            "Fluorodeoxyuridine (FdU)",
            "Leucovorin (LV)",
            "Afatinib (AFA)",
            "Encorafenib (ENC)",
            "Binimetinib (BIN)",
            "Sotorasib (SOT)",
            "Adagrasib (ADA)",
            "Famitinib (FAM)",
            "Fruquintinib (FRU)",
            "Teselimidrol (TES)",
            "TAS-117 (TAS)",
            "Onivyde (IRI-PEG)"
        ],
        "scorer": "gpt-4o",
        "judgement": {
            "matches": [
                "5-Fluorouracil (5-FU)",
                "Capecitabine (CAP)",
                "Oxaliplatin (OXA)",
                "Irinotecan (IRI)",
                "Bevacizumab (BEV)",
                "Cetuximab (CTX)",
                "Panitumumab (PAN)",
                "Regorafenib (REG)",
                "Zivafibine (ZIV)",
                "Trifluridine/Tipiracil (LONSURF)",
                "Ramucirumab (RAM)",
                "Folinic Acid (FA)",
                "Fluorodeoxyuridine (FdU)",
                "Leucovorin (LV)",
                "Afatinib (AFA)",
                "Encorafenib (ENC)",
                "Binimetinib (BIN)",
                "Sotorasib (SOT)",
                "Adagrasib (ADA)",
                "Famitinib (FAM)",
                "Fruquintinib (FRU)",
                "Teselimidrol (TES)",
                "TAS-117 (TAS)",
                "Onivyde (IRI-PEG)"
            ],
            "mismatches": [],
            "true_referents": [
                "5-Fluorouracil (5-FU)",
                "Adagrasib (ADA)",
                "Afatinib (AFA)",
                "Bevacizumab (BEV)",
                "Binimetinib (BIN)",
                "Capecitabine (CAP)",
                "Cetuximab (CTX)",
                "Encorafenib (ENC)",
                "Famitinib (FAM)",
                "Fluorodeoxyuridine (FdU)",
                "Folinic Acid (FA)",
                "Fruquintinib (FRU)",
                "Irinotecan (IRI)",
                "Leucovorin (LV)",
                "Onivyde (IRI-PEG)",
                "Oxaliplatin (OXA)",
                "Panitumumab (PAN)",
                "Ramucirumab (RAM)",
                "Regorafenib (REG)",
                "Sotorasib (SOT)",
                "TAS-117 (TAS)",
                "Teselimidrol (TES)",
                "Trifluridine/Tipiracil (LONSURF)",
                "Zivafibine (ZIV)"
            ],
            "TP": 24,
            "FP": 0,
            "FN": 0
        }
    },
    {
        "test": "limited-list-referents-from-selection-criteria",
        "responder": "gpt-4o",
        "concept": "approved drug for colorectal cancer",
        "domain": "medicine",
        "response": [
            "Fluorouracil (5-FU)",
            "Capecitabine (Xeloda)",
            "Oxaliplatin (Eloxatin)",
            "Irinotecan (Camptosar)",
            "Bevacizumab (Avastin)",
            "Cetuximab (Erbitux)",
            "Panitumumab (Vectibix)",
            "Regorafenib (Stivarga)",
            "Trifluridine/Tipiracil (Lonsurf)",
            "Ramucirumab (Cyramza)",
            "Ziv-aflibercept (Zaltrap)",
            "Pembrolizumab (Keytruda)",
            "Nivolumab (Opdivo)",
            "Atezolizumab (Tecentriq)",
            "Dostarlimab (Jemperli)",
            "Encorafenib (Braftovi)",
            "Binimetinib (Mektovi)",
            "Aflibercept (Zaltrap)",
            "Leucovorin (Wellcovorin)",
            "Sotorasib (Lumakras)",
            "Cetuximab and Encorafenib (Erbitux and Braftovi)",
            "Trastuzumab Deruxtecan (Enhertu)",
            "Larotrectinib (Vitrakvi)",
            "Entrectinib (Rozlytrek)"
        ],
        "scorer": "gpt-4o",
        "judgement": {
            "matches": [
                "Fluorouracil (5-FU)",
                "Capecitabine (Xeloda)",
                "Oxaliplatin (Eloxatin)",
                "Irinotecan (Camptosar)",
                "Bevacizumab (Avastin)",
                "Cetuximab (Erbitux)",
                "Panitumumab (Vectibix)",
                "Regorafenib (Stivarga)",
                "Trifluridine/Tipiracil (Lonsurf)",
                "Ramucirumab (Cyramza)",
                "Ziv-aflibercept (Zaltrap)",
                "Pembrolizumab (Keytruda)",
                "Nivolumab (Opdivo)",
                "Atezolizumab (Tecentriq)",
                "Dostarlimab (Jemperli)",
                "Encorafenib (Braftovi)",
                "Binimetinib (Mektovi)",
                "Aflibercept (Zaltrap)",
                "Leucovorin (Wellcovorin)",
                "Sotorasib (Lumakras)",
                "Cetuximab and Encorafenib (Erbitux and Braftovi)",
                "Trastuzumab Deruxtecan (Enhertu)",
                "Larotrectinib (Vitrakvi)",
                "Entrectinib (Rozlytrek)"
            ],
            "mismatches": [],
            "true_referents": [
                "Aflibercept (Zaltrap)",
                "Atezolizumab (Tecentriq)",
                "Bevacizumab (Avastin)",
                "Binimetinib (Mektovi)",
                "Capecitabine (Xeloda)",
                "Cetuximab (Erbitux)",
                "Cetuximab and Encorafenib (Erbitux and Braftovi)",
                "Dostarlimab (Jemperli)",
                "Encorafenib (Braftovi)",
                "Entrectinib (Rozlytrek)",
                "Fluorouracil (5-FU)",
                "Irinotecan (Camptosar)",
                "Larotrectinib (Vitrakvi)",
                "Leucovorin (Wellcovorin)",
                "Nivolumab (Opdivo)",
                "Oxaliplatin (Eloxatin)",
                "Panitumumab (Vectibix)",
                "Pembrolizumab (Keytruda)",
                "Ramucirumab (Cyramza)",
                "Regorafenib (Stivarga)",
                "Sotorasib (Lumakras)",
                "Trastuzumab Deruxtecan (Enhertu)",
                "Trifluridine/Tipiracil (Lonsurf)",
                "Ziv-aflibercept (Zaltrap)"
            ],
            "TP": 24,
            "FP": 0,
            "FN": 0
        }
    },
    {
        "test": "limited-list-referents-from-selection-criteria",
        "responder": "gpt-4o-mini",
        "concept": "approved drug for colorectal cancer",
        "domain": "medicine",
        "response": [
            "Colorectal Cancer Prevention (CCP)",
            "Bevacizumab (Avastin)",
            "Cetuximab (Erbitux)",
            "Capecitabine (Xeloda)",
            "Oxaliplatin (Eloxatin)",
            "FOLFIRI (Leucovorin, Fluorouracil, Irinotecan)",
            "FOLFOX (Leucovorin, Fluorouracil, Oxaliplatin)",
            "Regorafenib (Stivarga)",
            "Trifluridine/tipiracil (Lonsurf)",
            "Pembrolizumab (Keytruda)",
            "Nivolumab (Opdivo)",
            "Atezolizumab (Tecentriq)",
            "Ziv-aflibercept (Zaltrap)",
            "Lapatinib (Tykerb)",
            "Ramucirumab (Cyramza)",
            "Dolastatin-10 (Dola)",
            "Sunitinib (Sutent)",
            "Sorafenib (Nexavar)",
            "Nab-paclitaxel (Abraxane)",
            "Irinotecan (Camptosar)",
            "Fluorouracil (5-FU)",
            "Leucovorin (Folinic acid)",
            "Aspirin (Acetylsalicylic acid)",
            "Metformin (Glucophage)"
        ],
        "scorer": "gpt-4o",
        "judgement": {
            "matches": [
                "Colorectal Cancer Prevention (CCP)",
                "Bevacizumab (Avastin)",
                "Cetuximab (Erbitux)",
                "Capecitabine (Xeloda)",
                "Oxaliplatin (Eloxatin)",
                "FOLFIRI (Leucovorin, Fluorouracil, Irinotecan)",
                "FOLFOX (Leucovorin, Fluorouracil, Oxaliplatin)",
                "Regorafenib (Stivarga)",
                "Trifluridine/tipiracil (Lonsurf)",
                "Pembrolizumab (Keytruda)",
                "Nivolumab (Opdivo)",
                "Atezolizumab (Tecentriq)",
                "Ziv-aflibercept (Zaltrap)",
                "Lapatinib (Tykerb)",
                "Ramucirumab (Cyramza)",
                "Dolastatin-10 (Dola)",
                "Sunitinib (Sutent)",
                "Sorafenib (Nexavar)",
                "Nab-paclitaxel (Abraxane)",
                "Irinotecan (Camptosar)",
                "Fluorouracil (5-FU)",
                "Leucovorin (Folinic acid)",
                "Aspirin (Acetylsalicylic acid)",
                "Metformin (Glucophage)"
            ],
            "mismatches": [],
            "true_referents": [
                "Aspirin (Acetylsalicylic acid)",
                "Atezolizumab (Tecentriq)",
                "Bevacizumab (Avastin)",
                "Capecitabine (Xeloda)",
                "Cetuximab (Erbitux)",
                "Colorectal Cancer Prevention (CCP)",
                "Dolastatin-10 (Dola)",
                "FOLFIRI (Leucovorin, Fluorouracil, Irinotecan)",
                "FOLFOX (Leucovorin, Fluorouracil, Oxaliplatin)",
                "Fluorouracil (5-FU)",
                "Irinotecan (Camptosar)",
                "Lapatinib (Tykerb)",
                "Leucovorin (Folinic acid)",
                "Metformin (Glucophage)",
                "Nab-paclitaxel (Abraxane)",
                "Nivolumab (Opdivo)",
                "Oxaliplatin (Eloxatin)",
                "Pembrolizumab (Keytruda)",
                "Ramucirumab (Cyramza)",
                "Regorafenib (Stivarga)",
                "Sorafenib (Nexavar)",
                "Sunitinib (Sutent)",
                "Trifluridine/tipiracil (Lonsurf)",
                "Ziv-aflibercept (Zaltrap)"
            ],
            "TP": 24,
            "FP": 0,
            "FN": 0
        }
    },
    {
        "test": "limited-list-referents-from-selection-criteria",
        "responder": "gpt-4-32k",
        "concept": "approved drug for colorectal cancer",
        "domain": "medicine",
        "response": [
            "Capecitabine (Xeloda)",
            "Cetuximab (Erbitux)",
            "Bevacizumab (Avastin)",
            "Oxaliplatin (Eloxatin)",
            "Fluorouracil (Adrucil)",
            "Irinotecan (Camptosar)",
            "Regorafenib (Stivarga)",
            "Raltitrexed (Tomudex)",
            "Panitumumab (Vectibix)",
            "Trifluridine/Tipiracil (Lonsurf)",
            "Ramucirumab (Cyramza)",
            "Nivolumab (Opdivo)",
            "Pembrolizumab (Keytruda)",
            "Ziv-aflibercept (Zaltrap)",
            "Lapatinib (Tykerb)",
            "Binimetinib (Mektovi)",
            "Encorafenib (Braftovi)",
            "Sotorasib (Lumakras)",
            "Trifluridine (Ftudaf)",
            "Tipiracil (Tirf)",
            "Encorafenib (Braftovi)",
            "Binimetinib (Mektovi)",
            "Atezolizumab (Tecentriq)",
            "Ipilimumab (Yervoy)"
        ],
        "scorer": "gpt-4o",
        "judgement": {
            "matches": [
                "Capecitabine (Xeloda)",
                "Cetuximab (Erbitux)",
                "Bevacizumab (Avastin)",
                "Oxaliplatin (Eloxatin)",
                "Fluorouracil (Adrucil)",
                "Irinotecan (Camptosar)",
                "Regorafenib (Stivarga)",
                "Raltitrexed (Tomudex)",
                "Panitumumab (Vectibix)",
                "Trifluridine/Tipiracil (Lonsurf)",
                "Ramucirumab (Cyramza)",
                "Nivolumab (Opdivo)",
                "Pembrolizumab (Keytruda)",
                "Ziv-aflibercept (Zaltrap)",
                "Lapatinib (Tykerb)",
                "Binimetinib (Mektovi)",
                "Encorafenib (Braftovi)",
                "Sotorasib (Lumakras)",
                "Trifluridine (Ftudaf)",
                "Tipiracil (Tirf)",
                "Atezolizumab (Tecentriq)",
                "Ipilimumab (Yervoy)"
            ],
            "mismatches": [],
            "true_referents": [
                "Atezolizumab (Tecentriq)",
                "Bevacizumab (Avastin)",
                "Binimetinib (Mektovi)",
                "Capecitabine (Xeloda)",
                "Cetuximab (Erbitux)",
                "Encorafenib (Braftovi)",
                "Fluorouracil (Adrucil)",
                "Ipilimumab (Yervoy)",
                "Irinotecan (Camptosar)",
                "Lapatinib (Tykerb)",
                "Nivolumab (Opdivo)",
                "Oxaliplatin (Eloxatin)",
                "Panitumumab (Vectibix)",
                "Pembrolizumab (Keytruda)",
                "Raltitrexed (Tomudex)",
                "Ramucirumab (Cyramza)",
                "Regorafenib (Stivarga)",
                "Sotorasib (Lumakras)",
                "Tipiracil (Tirf)",
                "Trifluridine (Ftudaf)",
                "Trifluridine/Tipiracil (Lonsurf)",
                "Ziv-aflibercept (Zaltrap)"
            ],
            "TP": 22,
            "FP": 0,
            "FN": 0
        }
    },
    {
        "test": "limited-list-referents-from-selection-criteria",
        "responder": "gpt-35-turbo-16k",
        "concept": "approved drug for colorectal cancer",
        "domain": "medicine",
        "response": [
            "Avastin (bevacizumab)",
            "Erbitux (cetuximab)",
            "Vectibix (panitumumab)",
            "Stivarga (regorafenib)",
            "Zaltrap (ziv-aflibercept)",
            "Lonsurf (trifluridine and tipiracil)",
            "Keytruda (pembrolizumab)",
            "Opdivo (nivolumab)",
            "Tecentriq (atezolizumab)",
            "Cyramza (ramucirumab)",
            "Lartruvo (olaratumab)",
            "Zelboraf (vemurafenib)",
            "Cotellic (cobimetinib)",
            "Mekinist (trametinib)",
            "Tafinlar (dabrafenib)",
            "Lynparza (olaparib)",
            "Braftovi (encorafenib)",
            "Mektovi (binimetinib)",
            "Retevmo (selpercatinib)",
            "Tabrecta (capmatinib)",
            "Lumakras (sotorasib)",
            "Tukysa (tucatinib)",
            "Fotivda (tivozanib)",
            "Rubraca (rucaparib)"
        ],
        "scorer": "gpt-4o",
        "judgement": {
            "matches": [
                "Avastin (bevacizumab)",
                "Erbitux (cetuximab)",
                "Vectibix (panitumumab)",
                "Stivarga (regorafenib)",
                "Zaltrap (ziv-aflibercept)",
                "Lonsurf (trifluridine and tipiracil)",
                "Keytruda (pembrolizumab)",
                "Opdivo (nivolumab)",
                "Tecentriq (atezolizumab)",
                "Cyramza (ramucirumab)",
                "Lartruvo (olaratumab)",
                "Zelboraf (vemurafenib)",
                "Cotellic (cobimetinib)",
                "Mekinist (trametinib)",
                "Tafinlar (dabrafenib)",
                "Lynparza (olaparib)",
                "Braftovi (encorafenib)",
                "Mektovi (binimetinib)",
                "Retevmo (selpercatinib)",
                "Tabrecta (capmatinib)",
                "Lumakras (sotorasib)",
                "Tukysa (tucatinib)",
                "Fotivda (tivozanib)",
                "Rubraca (rucaparib)"
            ],
            "mismatches": [],
            "true_referents": [
                "Avastin (bevacizumab)",
                "Braftovi (encorafenib)",
                "Cotellic (cobimetinib)",
                "Cyramza (ramucirumab)",
                "Erbitux (cetuximab)",
                "Fotivda (tivozanib)",
                "Keytruda (pembrolizumab)",
                "Lartruvo (olaratumab)",
                "Lonsurf (trifluridine and tipiracil)",
                "Lumakras (sotorasib)",
                "Lynparza (olaparib)",
                "Mekinist (trametinib)",
                "Mektovi (binimetinib)",
                "Opdivo (nivolumab)",
                "Retevmo (selpercatinib)",
                "Rubraca (rucaparib)",
                "Stivarga (regorafenib)",
                "Tabrecta (capmatinib)",
                "Tafinlar (dabrafenib)",
                "Tecentriq (atezolizumab)",
                "Tukysa (tucatinib)",
                "Vectibix (panitumumab)",
                "Zaltrap (ziv-aflibercept)",
                "Zelboraf (vemurafenib)"
            ],
            "TP": 24,
            "FP": 0,
            "FN": 0
        }
    },
    {
        "test": "limited-list-referents-from-selection-criteria",
        "responder": "o1-mini",
        "concept": "approved drug for colorectal cancer",
        "domain": "medicine",
        "response": [
            "5-Fluorouracil (5-FU)",
            "Oxaliplatin",
            "Irinotecan",
            "Capecitabine",
            "Bevacizumab (Avastin)",
            "Cetuximab (Erbitux)",
            "Panitumumab (Vectibix)",
            "Aflibercept (Zaltrap)",
            "Regorafenib (Stivarga)",
            "Ramucirumab (Cyramza)",
            "Trifluridine/Tipiracil (Lonsurf)",
            "Pembrolizumab (Keytruda)",
            "Nivolumab (Opdivo)",
            "Encorafenib (Braftovi)",
            "Binimetinib (Mektovi)",
            "Leucovorin",
            "S-1",
            "FOLFIRI",
            "FOLFOX",
            "XELOX",
            "FOLFOXIRI",
            "FOLFIRI-Bevacizumab",
            "FOLFOX-Bevacizumab",
            "Cetuximab-Irinotecan"
        ],
        "scorer": "gpt-4o",
        "judgement": {
            "matches": [
                "5-Fluorouracil (5-FU)",
                "Oxaliplatin",
                "Irinotecan",
                "Capecitabine",
                "Bevacizumab (Avastin)",
                "Cetuximab (Erbitux)",
                "Panitumumab (Vectibix)",
                "Aflibercept (Zaltrap)",
                "Regorafenib (Stivarga)",
                "Ramucirumab (Cyramza)",
                "Trifluridine/Tipiracil (Lonsurf)",
                "Pembrolizumab (Keytruda)",
                "Nivolumab (Opdivo)",
                "Encorafenib (Braftovi)",
                "Binimetinib (Mektovi)",
                "Leucovorin",
                "S-1",
                "FOLFIRI",
                "FOLFOX",
                "XELOX",
                "FOLFOXIRI",
                "FOLFIRI-Bevacizumab",
                "FOLFOX-Bevacizumab",
                "Cetuximab-Irinotecan"
            ],
            "mismatches": [],
            "true_referents": [
                "5-Fluorouracil (5-FU)",
                "Aflibercept (Zaltrap)",
                "Bevacizumab (Avastin)",
                "Binimetinib (Mektovi)",
                "Capecitabine",
                "Cetuximab (Erbitux)",
                "Cetuximab-Irinotecan",
                "Encorafenib (Braftovi)",
                "FOLFIRI",
                "FOLFIRI-Bevacizumab",
                "FOLFOX",
                "FOLFOX-Bevacizumab",
                "FOLFOXIRI",
                "Irinotecan",
                "Leucovorin",
                "Nivolumab (Opdivo)",
                "Oxaliplatin",
                "Panitumumab (Vectibix)",
                "Pembrolizumab (Keytruda)",
                "Ramucirumab (Cyramza)",
                "Regorafenib (Stivarga)",
                "S-1",
                "Trifluridine/Tipiracil (Lonsurf)",
                "XELOX"
            ],
            "TP": 24,
            "FP": 0,
            "FN": 0
        }
    },
    {
        "test": "limited-list-referents-from-selection-criteria",
        "responder": "anthropic.claude-3-5-sonnet-v1:0",
        "concept": "approved drug for colorectal cancer",
        "domain": "medicine",
        "response": [
            "Fluorouracil (5-FU)",
            "Capecitabine (Xeloda)",
            "Oxaliplatin (Eloxatin)",
            "Irinotecan (Camptosar)",
            "Bevacizumab (Avastin)",
            "Cetuximab (Erbitux)",
            "Panitumumab (Vectibix)",
            "Regorafenib (Stivarga)",
            "Trifluridine/tipiracil (Lonsurf)",
            "Ramucirumab (Cyramza)",
            "Encorafenib (Braftovi)",
            "Binimetinib (Mektovi)",
            "Pembrolizumab (Keytruda)",
            "Nivolumab (Opdivo)",
            "Ipilimumab (Yervoy)",
            "Larotrectinib (Vitrakvi)",
            "Entrectinib (Rozlytrek)",
            "Dostarlimab (Jemperli)",
            "Leucovorin (Folinic acid)",
            "Levamisole"
        ],
        "scorer": "gpt-4o",
        "judgement": {
            "matches": [
                "Fluorouracil (5-FU)",
                "Capecitabine (Xeloda)",
                "Oxaliplatin (Eloxatin)",
                "Irinotecan (Camptosar)",
                "Bevacizumab (Avastin)",
                "Cetuximab (Erbitux)",
                "Panitumumab (Vectibix)",
                "Regorafenib (Stivarga)",
                "Trifluridine/tipiracil (Lonsurf)",
                "Ramucirumab (Cyramza)",
                "Encorafenib (Braftovi)",
                "Binimetinib (Mektovi)",
                "Pembrolizumab (Keytruda)",
                "Nivolumab (Opdivo)",
                "Ipilimumab (Yervoy)",
                "Larotrectinib (Vitrakvi)",
                "Entrectinib (Rozlytrek)",
                "Dostarlimab (Jemperli)",
                "Leucovorin (Folinic acid)",
                "Levamisole"
            ],
            "mismatches": [],
            "true_referents": [
                "Bevacizumab (Avastin)",
                "Binimetinib (Mektovi)",
                "Capecitabine (Xeloda)",
                "Cetuximab (Erbitux)",
                "Dostarlimab (Jemperli)",
                "Encorafenib (Braftovi)",
                "Entrectinib (Rozlytrek)",
                "Fluorouracil (5-FU)",
                "Ipilimumab (Yervoy)",
                "Irinotecan (Camptosar)",
                "Larotrectinib (Vitrakvi)",
                "Leucovorin (Folinic acid)",
                "Levamisole",
                "Nivolumab (Opdivo)",
                "Oxaliplatin (Eloxatin)",
                "Panitumumab (Vectibix)",
                "Pembrolizumab (Keytruda)",
                "Ramucirumab (Cyramza)",
                "Regorafenib (Stivarga)",
                "Trifluridine/tipiracil (Lonsurf)"
            ],
            "TP": 20,
            "FP": 0,
            "FN": 0
        }
    },
    {
        "test": "limited-list-referents-from-selection-criteria",
        "responder": "anthropic.claude-3-opus-v1:0",
        "concept": "approved drug for colorectal cancer",
        "domain": "medicine",
        "response": [
            "Fluorouracil (5-FU)",
            "Capecitabine (Xeloda)",
            "Irinotecan (Camptosar)",
            "Oxaliplatin (Eloxatin)",
            "Leucovorin (Folinic acid)",
            "Trifluridine/Tipiracil (Lonsurf)",
            "Bevacizumab (Avastin)",
            "Cetuximab (Erbitux)",
            "Panitumumab (Vectibix)",
            "Ramucirumab (Cyramza)",
            "Ziv-aflibercept (Zaltrap)",
            "Regorafenib (Stivarga)",
            "Pembrolizumab (Keytruda)",
            "Nivolumab (Opdivo)",
            "Ipilimumab (Yervoy)",
            "Encorafenib (Braftovi)",
            "Binimetinib (Mektovi)",
            "Dabrafenib (Tafinlar)",
            "Trametinib (Mekinist)",
            "Larotrectinib (Vitrakvi)",
            "Entrectinib (Rozlytrek)",
            "Dostarlimab-gxly (Jemperli)"
        ],
        "scorer": "gpt-4o",
        "judgement": {
            "matches": [
                "Fluorouracil (5-FU)",
                "Capecitabine (Xeloda)",
                "Irinotecan (Camptosar)",
                "Oxaliplatin (Eloxatin)",
                "Leucovorin (Folinic acid)",
                "Trifluridine/Tipiracil (Lonsurf)",
                "Bevacizumab (Avastin)",
                "Cetuximab (Erbitux)",
                "Panitumumab (Vectibix)",
                "Ramucirumab (Cyramza)",
                "Ziv-aflibercept (Zaltrap)",
                "Regorafenib (Stivarga)",
                "Pembrolizumab (Keytruda)",
                "Nivolumab (Opdivo)",
                "Ipilimumab (Yervoy)",
                "Encorafenib (Braftovi)",
                "Binimetinib (Mektovi)",
                "Dabrafenib (Tafinlar)",
                "Trametinib (Mekinist)",
                "Larotrectinib (Vitrakvi)",
                "Entrectinib (Rozlytrek)",
                "Dostarlimab-gxly (Jemperli)"
            ],
            "mismatches": [],
            "true_referents": [
                "Bevacizumab (Avastin)",
                "Binimetinib (Mektovi)",
                "Capecitabine (Xeloda)",
                "Cetuximab (Erbitux)",
                "Dabrafenib (Tafinlar)",
                "Dostarlimab-gxly (Jemperli)",
                "Encorafenib (Braftovi)",
                "Entrectinib (Rozlytrek)",
                "Fluorouracil (5-FU)",
                "Ipilimumab (Yervoy)",
                "Irinotecan (Camptosar)",
                "Larotrectinib (Vitrakvi)",
                "Leucovorin (Folinic acid)",
                "Nivolumab (Opdivo)",
                "Oxaliplatin (Eloxatin)",
                "Panitumumab (Vectibix)",
                "Pembrolizumab (Keytruda)",
                "Ramucirumab (Cyramza)",
                "Regorafenib (Stivarga)",
                "Trametinib (Mekinist)",
                "Trifluridine/Tipiracil (Lonsurf)",
                "Ziv-aflibercept (Zaltrap)"
            ],
            "TP": 22,
            "FP": 0,
            "FN": 0
        }
    },
    {
        "test": "limited-list-referents-from-selection-criteria",
        "responder": "anthropic.claude-3-sonnet-v1:0",
        "concept": "approved drug for colorectal cancer",
        "domain": "medicine",
        "response": [
            "Bevacizumab (Avastin)",
            "Capecitabine (Xeloda)",
            "Cetuximab (Erbitux)",
            "Irinotecan (Camptosar)",
            "Oxaliplatin (Eloxatin)",
            "Panitumumab (Vectibix)",
            "Regorafenib (Stivarga)",
            "Trifluridine/Tipiracil (Lonsurf)",
            "Pembrolizumab (Keytruda)",
            "Nivolumab (Opdivo)",
            "Ipilimumab (Yervoy)",
            "Ramucirumab (Cyramza)",
            "Aflibercept (Zaltrap)",
            "Encorafenib (Braftovi)",
            "Binimetinib (Mektovi)",
            "Trastuzumab (Herceptin)",
            "Pertuzumab (Perjeta)",
            "Lapatinib (Tykerb)",
            "Neratinib (Nerlynx)",
            "Ado-Trastuzumab Emtansine (Kadcyla)",
            "Fam-Trastuzumab Deruxtecan (Enhertu)",
            "Margetuximab (Margenza)",
            "Tucatinib (Tukysa)",
            "Sacituzumab Govitecan (Trodelvy)"
        ],
        "scorer": "gpt-4o",
        "judgement": {
            "matches": [
                "Bevacizumab (Avastin)",
                "Capecitabine (Xeloda)",
                "Cetuximab (Erbitux)",
                "Irinotecan (Camptosar)",
                "Oxaliplatin (Eloxatin)",
                "Panitumumab (Vectibix)",
                "Regorafenib (Stivarga)",
                "Trifluridine/Tipiracil (Lonsurf)",
                "Pembrolizumab (Keytruda)",
                "Nivolumab (Opdivo)",
                "Ipilimumab (Yervoy)",
                "Ramucirumab (Cyramza)",
                "Aflibercept (Zaltrap)",
                "Encorafenib (Braftovi)",
                "Binimetinib (Mektovi)",
                "Trastuzumab (Herceptin)",
                "Pertuzumab (Perjeta)",
                "Lapatinib (Tykerb)",
                "Neratinib (Nerlynx)",
                "Ado-Trastuzumab Emtansine (Kadcyla)",
                "Fam-Trastuzumab Deruxtecan (Enhertu)",
                "Margetuximab (Margenza)",
                "Tucatinib (Tukysa)",
                "Sacituzumab Govitecan (Trodelvy)"
            ],
            "mismatches": [],
            "true_referents": [
                "Ado-Trastuzumab Emtansine (Kadcyla)",
                "Aflibercept (Zaltrap)",
                "Bevacizumab (Avastin)",
                "Binimetinib (Mektovi)",
                "Capecitabine (Xeloda)",
                "Cetuximab (Erbitux)",
                "Encorafenib (Braftovi)",
                "Fam-Trastuzumab Deruxtecan (Enhertu)",
                "Ipilimumab (Yervoy)",
                "Irinotecan (Camptosar)",
                "Lapatinib (Tykerb)",
                "Margetuximab (Margenza)",
                "Neratinib (Nerlynx)",
                "Nivolumab (Opdivo)",
                "Oxaliplatin (Eloxatin)",
                "Panitumumab (Vectibix)",
                "Pembrolizumab (Keytruda)",
                "Pertuzumab (Perjeta)",
                "Ramucirumab (Cyramza)",
                "Regorafenib (Stivarga)",
                "Sacituzumab Govitecan (Trodelvy)",
                "Trastuzumab (Herceptin)",
                "Trifluridine/Tipiracil (Lonsurf)",
                "Tucatinib (Tukysa)"
            ],
            "TP": 24,
            "FP": 0,
            "FN": 0
        }
    },
    {
        "test": "limited-list-referents-from-selection-criteria",
        "responder": "anthropic.claude-3-haiku-v1:0",
        "concept": "approved drug for colorectal cancer",
        "domain": "medicine",
        "response": [
            "Aspirin (ASA)",
            "Bevacizumab (BEV)",
            "Capecitabine (CAP)",
            "Cetuximab (CET)",
            "Encorafenib (ENC)",
            "Fluorouracil (FLU)",
            "Irinotecan (IRI)",
            "Lenvatinib (LEN)",
            "Nivolumab (NIV)",
            "Oxaliplatin (OXA)",
            "Panitumumab (PAN)",
            "Pembrolizumab (PEM)",
            "Ramucirumab (RAM)",
            "Regorafenib (REG)",
            "Sorafenib (SOR)",
            "Trifluridine/Tipiracil (TRI)",
            "Trametinib (TRA)",
            "Trastuzumab (TRA)",
            "Vemurafenib (VEM)",
            "Ziv-Aflibercept (ZIV)"
        ],
        "scorer": "gpt-4o",
        "judgement": {
            "matches": [
                "Aspirin (ASA)",
                "Bevacizumab (BEV)",
                "Capecitabine (CAP)",
                "Cetuximab (CET)",
                "Encorafenib (ENC)",
                "Fluorouracil (FLU)",
                "Irinotecan (IRI)",
                "Lenvatinib (LEN)",
                "Nivolumab (NIV)",
                "Oxaliplatin (OXA)",
                "Panitumumab (PAN)",
                "Pembrolizumab (PEM)",
                "Ramucirumab (RAM)",
                "Regorafenib (REG)",
                "Sorafenib (SOR)",
                "Trifluridine/Tipiracil (TRI)",
                "Trametinib (TRA)",
                "Trastuzumab (TRA)",
                "Vemurafenib (VEM)",
                "Ziv-Aflibercept (ZIV)"
            ],
            "mismatches": [],
            "true_referents": [
                "Aspirin (ASA)",
                "Bevacizumab (BEV)",
                "Capecitabine (CAP)",
                "Cetuximab (CET)",
                "Encorafenib (ENC)",
                "Fluorouracil (FLU)",
                "Irinotecan (IRI)",
                "Lenvatinib (LEN)",
                "Nivolumab (NIV)",
                "Oxaliplatin (OXA)",
                "Panitumumab (PAN)",
                "Pembrolizumab (PEM)",
                "Ramucirumab (RAM)",
                "Regorafenib (REG)",
                "Sorafenib (SOR)",
                "Trametinib (TRA)",
                "Trastuzumab (TRA)",
                "Trifluridine/Tipiracil (TRI)",
                "Vemurafenib (VEM)",
                "Ziv-Aflibercept (ZIV)"
            ],
            "TP": 20,
            "FP": 0,
            "FN": 0
        }
    },
    {
        "test": "limited-list-referents-from-selection-criteria",
        "responder": "meta.llama3-8b-instruct-v1:0",
        "concept": "approved drug for colorectal cancer",
        "domain": "medicine",
        "response": [
            "Avastin (Bevacizumab)",
            "Erlotinib",
            "Capecitabine",
            "Oxaliplatin",
            "FOLFIRI",
            "FOLFOX",
            "Panitumumab",
            "Cetuximab",
            "regorafenib",
            "BRAF inhibitors",
            "Vemurafenib",
            "Dabrafenib",
            "Trametinib",
            "Nivolumab",
            "Pembrolizumab",
            "Ramucirumab",
            "Bevacizumab + FOLFOX",
            "FOLFIRINOX",
            "Capox",
            "FOLFOXIRI",
            "Lenvatinib",
            "Aflibercept",
            "Ramucirumab + FOLFIRI",
            "regorafenib + cetuximab",
            "regorafenib + bevacizumab",
            "Nivolumab + ipilimumab"
        ],
        "scorer": "gpt-4o",
        "judgement": {
            "matches": [
                "Avastin (Bevacizumab)",
                "Erlotinib",
                "Capecitabine",
                "Oxaliplatin",
                "FOLFIRI",
                "FOLFOX",
                "Panitumumab",
                "Cetuximab",
                "regorafenib",
                "BRAF inhibitors",
                "Vemurafenib",
                "Dabrafenib",
                "Trametinib",
                "Nivolumab",
                "Pembrolizumab",
                "Ramucirumab",
                "Bevacizumab + FOLFOX",
                "FOLFIRINOX",
                "Capox",
                "FOLFOXIRI",
                "Lenvatinib",
                "Aflibercept",
                "Ramucirumab + FOLFIRI",
                "regorafenib + cetuximab"
            ],
            "mismatches": [
                "regorafenib + bevacizumab",
                "Nivolumab + ipilimumab"
            ],
            "true_referents": [
                "Aflibercept",
                "Avastin (Bevacizumab)",
                "BRAF inhibitors",
                "Bevacizumab + FOLFOX",
                "Capecitabine",
                "Capox",
                "Cetuximab",
                "Dabrafenib",
                "Erlotinib",
                "FOLFIRI",
                "FOLFIRINOX",
                "FOLFOX",
                "FOLFOXIRI",
                "Lenvatinib",
                "Nivolumab",
                "Oxaliplatin",
                "Panitumumab",
                "Pembrolizumab",
                "Ramucirumab",
                "Ramucirumab + FOLFIRI",
                "Trametinib",
                "Vemurafenib",
                "regorafenib",
                "regorafenib + cetuximab"
            ],
            "TP": 24,
            "FP": 2,
            "FN": 0
        }
    },
    {
        "test": "limited-list-referents-from-selection-criteria",
        "responder": "meta.llama3-70b-instruct-v1:0",
        "concept": "approved drug for colorectal cancer",
        "domain": "medicine",
        "response": [
            "Capecitabine (Xeloda)",
            "Oxaliplatin (Eloxatin)",
            "Irinotecan (Camptosar)",
            "5-Fluorouracil (5-FU)",
            "Levamisole",
            "Bevacizumab (Avastin)",
            "Cetuximab (Erbitux)",
            "Panitumumab (Vectibix)",
            "Ramucirumab (Cyramza)",
            "Aflibercept (Zaltrap)",
            "Regorafenib (Stivarga)",
            "Trifluridine/tipiracil (Lonsurf)",
            "Encorafenib (Braftovi)",
            "Binimetinib (Mektovi)",
            "Cemiplimab (Libtayo)",
            "Nivolumab (Opdivo)",
            "Ipilimumab (Yervoy)",
            "Ramucirumab (Cyramza)",
            "Pembrolizumab (Keytruda)",
            "Atezolizumab (Tecentriq)",
            "Durvalumab (Imfinzi)",
            "Tremelimumab",
            "Sorafenib (Nexavar)",
            "Vemurafenib (Zelboraf)"
        ],
        "scorer": "gpt-4o",
        "judgement": {
            "matches": [
                "Capecitabine (Xeloda)",
                "Oxaliplatin (Eloxatin)",
                "Irinotecan (Camptosar)",
                "5-Fluorouracil (5-FU)",
                "Levamisole",
                "Bevacizumab (Avastin)",
                "Cetuximab (Erbitux)",
                "Panitumumab (Vectibix)",
                "Ramucirumab (Cyramza)",
                "Aflibercept (Zaltrap)",
                "Regorafenib (Stivarga)",
                "Trifluridine/tipiracil (Lonsurf)",
                "Encorafenib (Braftovi)",
                "Binimetinib (Mektovi)",
                "Cemiplimab (Libtayo)",
                "Nivolumab (Opdivo)",
                "Ipilimumab (Yervoy)",
                "Pembrolizumab (Keytruda)",
                "Atezolizumab (Tecentriq)",
                "Durvalumab (Imfinzi)",
                "Tremelimumab",
                "Sorafenib (Nexavar)",
                "Vemurafenib (Zelboraf)"
            ],
            "mismatches": [],
            "true_referents": [
                "5-Fluorouracil (5-FU)",
                "Aflibercept (Zaltrap)",
                "Atezolizumab (Tecentriq)",
                "Bevacizumab (Avastin)",
                "Binimetinib (Mektovi)",
                "Capecitabine (Xeloda)",
                "Cemiplimab (Libtayo)",
                "Cetuximab (Erbitux)",
                "Durvalumab (Imfinzi)",
                "Encorafenib (Braftovi)",
                "Ipilimumab (Yervoy)",
                "Irinotecan (Camptosar)",
                "Levamisole",
                "Nivolumab (Opdivo)",
                "Oxaliplatin (Eloxatin)",
                "Panitumumab (Vectibix)",
                "Pembrolizumab (Keytruda)",
                "Ramucirumab (Cyramza)",
                "Regorafenib (Stivarga)",
                "Sorafenib (Nexavar)",
                "Tremelimumab",
                "Trifluridine/tipiracil (Lonsurf)",
                "Vemurafenib (Zelboraf)"
            ],
            "TP": 23,
            "FP": 0,
            "FN": 0
        }
    },
    {
        "test": "limited-list-referents-from-selection-criteria",
        "responder": "amazon.titan-text-express-v1",
        "concept": "approved drug for colorectal cancer",
        "domain": "medicine",
        "response": [
            {
                "Referent": "5-fluorouracil (5-FU)",
                "Canonical name": "5-Fluorouracil"
            },
            {
                "Referent": "capecitabine (Xeloda)",
                "Canonical name": "Capecitabine"
            },
            {
                "Referent": "irinotecan (Camptosar)",
                "Canonical name": "Irinotecan"
            },
            {
                "Referent": "oxaliplatin (Eloxatin)",
                "Canonical name": "Oxaliplatin"
            },
            {
                "Referent": "bevacizumab (Avastin)",
                "Canonical name": "Bevacizumab"
            },
            {
                "Referent": "aflibercept (Zaltrap)",
                "Canonical name": "Aflibercept"
            },
            {
                "Referent": "regorafenib (Stivarga)",
                "Canonical name": "Regorafenib"
            },
            {
                "Referent": "panitumumab (Vectibix)",
                "Canonical name": "Panitumumab"
            },
            {
                "Referent": "cetuximab (Erbitux)",
                "Canonical name": "Cetuximab"
            },
            {
                "Referent": "ramucirumab (Cyramza)",
                "Canonical name": "Ramucirumab"
            },
            {
                "Referent": "trifluridine/tipiracil (Lonsurf)",
                "Canonical name": "Trifluridine/tipiracil"
            },
            {
                "Referent": "nivolumab (Opdivo)",
                "Canonical name": "Nivolumab"
            },
            {
                "Referent": "pembrolizumab (Keytruda)",
                "Canonical name": "Pembrolizumab"
            },
            {
                "Referent": "atezolizumab (Tecentriq)",
                "Canonical name": "Atezolizumab"
            },
            {
                "Referent": "durvalumab (Imfinzi)",
                "Canonical name": "Durvalumab"
            },
            {
                "Referent": "avelumab (Bavencio)",
                "Canonical name": "Avelumab"
            },
            {
                "Referent": "tremelimumab (Imjuvia)",
                "Canonical name": "Tremelimumab"
            },
            {
                "Referent": "ipilimumab (Yervoy)",
                "Canonical name": "Ipilimumab"
            },
            {
                "Referent": "nivolumab/ipilimumab (Opdivo/Yervoy)",
                "Canonical name": "Nivolumab/ipilimumab"
            },
            {
                "Referent": "dostarlimab (Jemperli)",
                "Canonical name": "Dostarlimab"
            },
            {
                "Referent": "tucatinib (Tukysa)",
                "Canonical name": "Tucatinib"
            },
            {
                "Referent": "enfuvirtide (Fuzeon)",
                "Canonical name": "Enfuvirtide"
            },
            {
                "Referent": "maraviroc (Selzentry)",
                "Canonical name": "Maraviroc"
            },
            {
                "Referent": "raltegravir (Isentress)",
                "Canonical name": "Raltegravir"
            },
            {
                "Referent": "elvitegravir/cobicistat/emtricitabine/tenofovir alafenamide (Biktarvy)",
                "Canonical name": "Elvitegravir/cobicistat/emtricitabine/tenofovir alafenamide"
            },
            {
                "Referent": "dolutegravir (Tivicay)",
                "Canonical name": "Dolutegravir"
            },
            {
                "Referent": "lamivudine/raltegravir (Epzicom)",
                "Canonical name": "Lamivudine/raltegravir"
            },
            {
                "Referent": "atazanavir/cobicistat (Evotaz)",
                "Canonical name": "Atazanavir/cobicistat"
            },
            {
                "Referent": "darunavir/cobicistat (Prezista)",
                "Canonical name": "Darunavir/cobicistat"
            },
            {
                "Referent": "lopinavir/ritonavir (Kaletra)",
                "Canonical name": "Lopinavir/ritonavir"
            },
            {
                "Referent": "elvitegravir/cobicistat/emtricitabine/tenofovir disoproxil fumarate (Stribild)",
                "Canonical name": "Elvitegravir/cobicistat/emtricitabine/tenofovir disoproxil fumarate"
            },
            {
                "Referent": "atazanavir/cobicistat/emtricitabine/tenofovir disoproxil fumarate (Evotaz/Genvoya)",
                "Canonical name": "Atazanavir/cobicistat/emtricitabine/tenofovir disoproxil fumarate"
            },
            {
                "Referent": "dolutegravir/abacavir/lamivudine (Triumeq)",
                "Canonical name": "Dolutegravir/abacavir/lamivudine"
            },
            {
                "Referent": "lamivudine/abacavir/dolutegravir (Triumeq)",
                "Canonical name": "Lamivudine/abacavir/dolutegravir"
            },
            {
                "Referent": "dolutegravir/lamivudine (Dovato)",
                "Canonical name": "Dolutegravir/lamivudine"
            },
            {
                "Referent": "abacavir/dolutegravir/lamivudine (Triumeq)",
                "Canonical name": "Abacavir/dolutegravir/lamivudine"
            }
        ],
        "scorer": "gpt-4o",
        "judgement": {
            "matches": [
                "5-Fluorouracil",
                "Capecitabine",
                "Irinotecan",
                "Oxaliplatin",
                "Bevacizumab",
                "Aflibercept",
                "Regorafenib",
                "Panitumumab",
                "Cetuximab",
                "Ramucirumab",
                "Trifluridine/tipiracil",
                "Nivolumab",
                "Pembrolizumab",
                "Atezolizumab",
                "Durvalumab",
                "Avelumab",
                "Tremelimumab",
                "Ipilimumab",
                "Nivolumab/ipilimumab",
                "Dostarlimab",
                "Tucatinib",
                "Enfuvirtide",
                "Maraviroc",
                "Raltegravir"
            ],
            "mismatches": [
                "Elvitegravir/cobicistat/emtricitabine/tenofovir alafenamide",
                "Dolutegravir",
                "Lamivudine/raltegravir",
                "Atazanavir/cobicistat",
                "Darunavir/cobicistat",
                "Lopinavir/ritonavir",
                "Elvitegravir/cobicistat/emtricitabine/tenofovir disoproxil fumarate",
                "Atazanavir/cobicistat/emtricitabine/tenofovir disoproxil fumarate",
                "Dolutegravir/abacavir/lamivudine",
                "Lamivudine/abacavir/dolutegravir",
                "Dolutegravir/lamivudine",
                "Abacavir/dolutegravir/lamivudine"
            ],
            "true_referents": [
                "{\"Referent\": \"5-fluorouracil (5-FU)\", \"Canonical name\": \"5-Fluorouracil\"}",
                "{\"Referent\": \"aflibercept (Zaltrap)\", \"Canonical name\": \"Aflibercept\"}",
                "{\"Referent\": \"atezolizumab (Tecentriq)\", \"Canonical name\": \"Atezolizumab\"}",
                "{\"Referent\": \"avelumab (Bavencio)\", \"Canonical name\": \"Avelumab\"}",
                "{\"Referent\": \"bevacizumab (Avastin)\", \"Canonical name\": \"Bevacizumab\"}",
                "{\"Referent\": \"capecitabine (Xeloda)\", \"Canonical name\": \"Capecitabine\"}",
                "{\"Referent\": \"cetuximab (Erbitux)\", \"Canonical name\": \"Cetuximab\"}",
                "{\"Referent\": \"dostarlimab (Jemperli)\", \"Canonical name\": \"Dostarlimab\"}",
                "{\"Referent\": \"durvalumab (Imfinzi)\", \"Canonical name\": \"Durvalumab\"}",
                "{\"Referent\": \"enfuvirtide (Fuzeon)\", \"Canonical name\": \"Enfuvirtide\"}",
                "{\"Referent\": \"ipilimumab (Yervoy)\", \"Canonical name\": \"Ipilimumab\"}",
                "{\"Referent\": \"irinotecan (Camptosar)\", \"Canonical name\": \"Irinotecan\"}",
                "{\"Referent\": \"maraviroc (Selzentry)\", \"Canonical name\": \"Maraviroc\"}",
                "{\"Referent\": \"nivolumab (Opdivo)\", \"Canonical name\": \"Nivolumab\"}",
                "{\"Referent\": \"nivolumab/ipilimumab (Opdivo/Yervoy)\", \"Canonical name\": \"Nivolumab/ipilimumab\"}",
                "{\"Referent\": \"oxaliplatin (Eloxatin)\", \"Canonical name\": \"Oxaliplatin\"}",
                "{\"Referent\": \"panitumumab (Vectibix)\", \"Canonical name\": \"Panitumumab\"}",
                "{\"Referent\": \"pembrolizumab (Keytruda)\", \"Canonical name\": \"Pembrolizumab\"}",
                "{\"Referent\": \"raltegravir (Isentress)\", \"Canonical name\": \"Raltegravir\"}",
                "{\"Referent\": \"ramucirumab (Cyramza)\", \"Canonical name\": \"Ramucirumab\"}",
                "{\"Referent\": \"regorafenib (Stivarga)\", \"Canonical name\": \"Regorafenib\"}",
                "{\"Referent\": \"tremelimumab (Imjuvia)\", \"Canonical name\": \"Tremelimumab\"}",
                "{\"Referent\": \"trifluridine/tipiracil (Lonsurf)\", \"Canonical name\": \"Trifluridine/tipiracil\"}",
                "{\"Referent\": \"tucatinib (Tukysa)\", \"Canonical name\": \"Tucatinib\"}"
            ],
            "TP": 24,
            "FP": 12,
            "FN": 0
        }
    }
]