[
    {
        "test": "limited-list-referents",
        "responder": "qwen-v2.5-14b-instruct",
        "concept": "approved drug for hypertension",
        "domain": "medicine",
        "response": [
            "Amlodipine (AML)",
            "Losartan (LOS)",
            "Metoprolol (MET)",
            "Hydrochlorothiazide (HCTZ)",
            "Valsartan (VAL)",
            "Lisinopril (LIS)",
            "Furosemide (FUR)",
            "Enalapril (ENA)",
            "Propranolol (PRO)",
            "Atenolol (ATE)",
            "Captopril (CAP)",
            "Nifedipine (NIF)",
            "Diltiazem (DIL)",
            "Spironolactone (SPI)",
            "Bisoprolol (BIS)",
            "Acarbose (ACA)",
            "Vardenafil (VAR)",
            "Telmisartan (TEL)",
            "Amiloride (AMI)",
            "Chlorthalidone (CHL)",
            "Eplerenone (EPL)",
            "Verapamil (VER)",
            "Olmesartan (OLM)",
            "Prazosin (PRA)"
        ],
        "scorer": "gpt-4o",
        "judgement": {
            "matches": [
                "Atenolol",
                "Amiloride",
                "Amlodipine",
                "Bisoprolol",
                "Captopril",
                "Chlorthalidone",
                "Diltiazem",
                "Enalapril",
                "Eplerenone",
                "Furosemide",
                "Hydrochlorothiazide",
                "Lisinopril",
                "Losartan",
                "Metoprolol",
                "Nifedipine",
                "Olmesartan",
                "Prazosin",
                "Propranolol",
                "Spironolactone",
                "Telmisartan",
                "Valsartan",
                "Vardenafil",
                "Verapamil"
            ],
            "mismatches": [
                "Acarbose"
            ],
            "true_referents": [
                "AMILORIDE HYDROCHLORIDE",
                "AMLODIPINE BESYLATE",
                "ATENOLOL",
                "Acetylcysteine",
                "Amiloride Hydrochloride",
                "Amlodipine + Valsartan",
                "Amlodipine Besylate",
                "Atenolol",
                "BISOPROLOL FUMARATE",
                "Bisoprolol fumarate",
                "Bunazosin",
                "CAPTOPRIL",
                "CARVEDILOL",
                "CHLOROTHIAZIDE",
                "CHLORTHALIDONE",
                "Candesartan + Chlorthalidone",
                "Captopril",
                "Chlorthalidone",
                "DILTIAZEM HYDROCHLORIDE",
                "Diltiazem hydrochloride",
                "ENALAPRIL MALEATE",
                "EPLERENONE",
                "Enalapril maleate",
                "Enalaprilat",
                "Eplerenone",
                "Epoprostenol",
                "FUROSEMIDE",
                "Furosemide",
                "HYDROCHLOROTHIAZIDE",
                "Hydrochlorothiazide",
                "Indenolol",
                "LISINOPRIL",
                "LOSARTAN POTASSIUM",
                "Levacecarnine",
                "Levamlodipine",
                "Lisinopril",
                "Losartan potassium",
                "Losartan potassium + Hydrochlorothiazide",
                "METOPROLOL TARTRATE",
                "Metformin Hydrochloride",
                "Metoprolol",
                "Moprolol",
                "NIFEDIPINE",
                "Nifedipine",
                "Nimodipine",
                "OLMESARTAN MEDOXOMIL",
                "Olmesartan medoxomil",
                "PRAZOSIN",
                "PRAZOSIN HYDROCHLORIDE",
                "PROPRANOLOL HYDROCHLORIDE",
                "Perindopril",
                "Propranolol hydrochloride",
                "SPIRONOLACTONE",
                "Spironolactone",
                "Spironolactone+Furosemide",
                "Spirorenone",
                "TADALAFIL",
                "TELMISARTAN",
                "Tadalafil",
                "Telmisartan",
                "Telmisartan + Ramipril",
                "Teoprolol",
                "VALSARTAN",
                "VERAPAMIL HYDROCHLORIDE",
                "Valsartan",
                "Vardenafil hydrochloride",
                "Verapamil Hydrochloride"
            ],
            "TP": 23,
            "FP": 1,
            "FN": 0
        }
    },
    {
        "test": "limited-list-referents",
        "responder": "phi-v4",
        "concept": "approved drug for hypertension",
        "domain": "medicine",
        "response": [
            "Lisinopril (ACE inhibitor)",
            "Amlodipine (Calcium channel blocker)",
            "Hydrochlorothiazide (Thiazide diuretic)",
            "Losartan (Angiotensin II receptor blocker)",
            "Metoprolol (Beta-blocker)",
            "Valsartan (Angiotensin II receptor blocker)",
            "Candesartan (Angiotensin II receptor blocker)",
            "Olmesartan (Angiotensin II receptor blocker)",
            "Nifedipine (Calcium channel blocker)",
            "Furosemide (Loop diuretic)",
            "Spironolactone (Aldosterone antagonist)",
            "Enalapril (ACE inhibitor)",
            "Ramipril (ACE inhibitor)",
            "Diltiazem (Calcium channel blocker)",
            "Bisoprolol (Beta-blocker)",
            "Carvedilol (Beta-blocker)",
            "Telmisartan (Angiotensin II receptor blocker)",
            "Irbesartan (Angiotensin II receptor blocker)",
            "Captopril (ACE inhibitor)",
            "Felodipine (Calcium channel blocker)",
            "Clonidine (Alpha-2 adrenergic agonist)",
            "Methyldopa (Alpha-2 adrenergic agonist)",
            "Azilsartan (Angiotensin II receptor blocker)",
            "Valsartan/Hydrochlorothiazide (Combination drug)"
        ],
        "scorer": "gpt-4o",
        "judgement": {
            "matches": [
                "Lisinopril",
                "Amlodipine",
                "Hydrochlorothiazide",
                "Metoprolol",
                "Valsartan",
                "Candesartan",
                "Nifedipine",
                "Furosemide",
                "Spironolactone",
                "Enalapril",
                "Ramipril",
                "Diltiazem",
                "Bisoprolol",
                "Carvedilol",
                "Telmisartan",
                "Irbesartan",
                "Captopril",
                "Felodipine",
                "Clonidine",
                "Methyl-DOPA"
            ],
            "mismatches": [
                "Losartan",
                "Olmesartan",
                "Azilsartan",
                "Valsartan/Hydrochlorothiazide"
            ],
            "true_referents": [
                "Amlodipine + Valsartan",
                "Amlodipine Besylate + Hydrochlorothiazide + Valsartan",
                "Bisoprolol fumarate",
                "CAPTOPRIL",
                "CARVEDILOL",
                "CARVEDILOL PHOSPHATE",
                "CHLOROTHIAZIDE",
                "CLONIDINE",
                "CLONIDINE HYDROCHLORIDE",
                "Candesartan",
                "Captopril",
                "Carvedilol",
                "Clonidine",
                "DILTIAZEM HYDROCHLORIDE",
                "Diltiazem hydrochloride",
                "ENALAPRIL MALEATE",
                "Enalapril maleate",
                "FELODIPINE",
                "FUROSEMIDE",
                "Felodipine",
                "Furosemide",
                "HYDROCHLOROTHIAZIDE",
                "Hydrochlorothiazide",
                "IRBESARTAN",
                "Irbesartan",
                "Irbesartan + Amlodipine",
                "LISINOPRIL",
                "LOSARTAN POTASSIUM",
                "Levamlodipine",
                "Lisinopril",
                "Losartan potassium",
                "METHYLDOPA",
                "Methyl-DOPA",
                "Metoprolol",
                "NIFEDIPINE",
                "Nifedipine",
                "Nimodipine",
                "Perindopril",
                "RAMIPRIL",
                "Ramipril",
                "SPIRONOLACTONE",
                "Saprisartan",
                "Spironolactone",
                "Spironolactone+Furosemide",
                "TELMISARTAN",
                "Telmisartan",
                "Telmisartan + Ramipril",
                "Teoprolol",
                "Toliprolol",
                "VALSARTAN",
                "Valsartan"
            ],
            "TP": 20,
            "FP": 4,
            "FN": 0
        }
    },
    {
        "test": "limited-list-referents",
        "responder": "mistral-small-instruct-24B",
        "concept": "approved drug for hypertension",
        "domain": "medicine",
        "response": [
            "Amlodipine (AML)",
            "Lisinopril (LIS)",
            "Losartan (LOS)",
            "Metoprolol (MET)",
            "Hydrochlorothiazide (HCT)",
            "Enalapril (ENA)",
            "Valsartan (VAL)",
            "Atenolol (ATE)",
            "Candesartan (CAN)",
            "Ramipril (RAM)",
            "Furosemide (FUR)",
            "Propranolol (PRO)",
            "Telmisartan (TEL)",
            "Irbesartan (IRB)",
            "Benazepril (BEN)",
            "Diltiazem (DIL)",
            "Bisoprolol (BIS)",
            "Spironolactone (SPI)",
            "Nifedipine (NIF)",
            "Eplerenone (EPL)",
            "Clonidine (CLO)",
            "Minoxidil (MIN)",
            "Nicardipine (NIC)",
            "Prazosin (PRA)"
        ],
        "scorer": "gpt-4o",
        "judgement": {
            "matches": [
                "Lisinopril",
                "Metoprolol",
                "Hydrochlorothiazide",
                "Enalapril maleate",
                "Valsartan",
                "Atenolol",
                "Candesartan",
                "Ramipril",
                "Furosemide",
                "Propranolol hydrochloride",
                "Telmisartan",
                "Irbesartan",
                "Benazepril Hydrochloride",
                "Diltiazem hydrochloride",
                "Bisoprolol fumarate",
                "Spironolactone",
                "Nifedipine",
                "Eplerenone",
                "Clonidine",
                "Nicardipine hydrochloride",
                "Prazosin"
            ],
            "mismatches": [
                "Amlodipine (AML)",
                "Losartan (LOS)",
                "Minoxidil (MIN)"
            ],
            "true_referents": [
                "AMLODIPINE BESYLATE",
                "ATENOLOL",
                "Amlodipine + Valsartan",
                "Amlodipine Besylate",
                "Amlodipine Besylate + Benazepril Hydrochloride",
                "Atenolol",
                "BENAZEPRIL HYDROCHLORIDE",
                "BISOPROLOL FUMARATE",
                "Benazepril Hydrochloride",
                "Bisoprolol fumarate",
                "Bunazosin",
                "CANDESARTAN CILEXETIL",
                "CARVEDILOL",
                "CLONIDINE",
                "CLONIDINE HYDROCHLORIDE",
                "Candesartan",
                "Candesartan cilexetil",
                "Chlorothiazide",
                "Clonidine",
                "DILTIAZEM HYDROCHLORIDE",
                "Diltiazem hydrochloride",
                "ENALAPRIL MALEATE",
                "EPLERENONE",
                "Enalapril maleate",
                "Enalaprilat",
                "Eplerenone",
                "Epoprostenol",
                "FUROSEMIDE",
                "Furosemide",
                "HYDROCHLOROTHIAZIDE",
                "Hydrochlorothiazide",
                "IRBESARTAN",
                "Indenolol",
                "Irbesartan",
                "Irbesartan + Amlodipine",
                "LISINOPRIL",
                "LOSARTAN POTASSIUM",
                "Levamlodipine",
                "Lisinopril",
                "Losartan potassium",
                "Losartan potassium + Hydrochlorothiazide",
                "METOPROLOL TARTRATE",
                "MINOXIDIL",
                "Metoprolol",
                "Moprolol",
                "NICARDIPINE HYDROCHLORIDE",
                "NIFEDIPINE",
                "Nicardipine hydrochloride",
                "Nifedipine",
                "Nimodipine",
                "PRAZOSIN",
                "PRAZOSIN HYDROCHLORIDE",
                "PROPRANOLOL HYDROCHLORIDE",
                "Perindopril",
                "Propranolol hydrochloride",
                "RAMIPRIL",
                "Ramipril",
                "SPIRONOLACTONE",
                "Spironolactone",
                "Spironolactone+Furosemide",
                "Spirorenone",
                "TADALAFIL",
                "TELMISARTAN",
                "Tadalafil",
                "Telmisartan",
                "Telmisartan + Ramipril",
                "Teoprolol",
                "VALSARTAN",
                "Valsartan"
            ],
            "TP": 21,
            "FP": 3,
            "FN": 0
        }
    },
    {
        "test": "limited-list-referents",
        "responder": "gemma-3",
        "concept": "approved drug for hypertension",
        "domain": "medicine",
        "response": [
            "Lisinopril (Prinivil, Zestril)",
            "Amlodipine (Norvasc)",
            "Hydrochlorothiazide (HCTZ)",
            "Losartan (Cozaar)",
            "Metoprolol (Lopressor, Toprol XL)",
            "Atenolol (Tenormin)",
            "Ramipril (Altace)",
            "Valsartan (Diovan)",
            "Diltiazem (Cardizem, Tiazac)",
            "Verapamil (Calan, Verelan)",
            "Chlorthalidone",
            "Spironolactone (Aldactone)",
            "Furosemide (Lasix)",
            "Enapril (Vasotec)",
            "Telmisartan (Micardis)",
            "Olmesartan (Benicar)",
            "Nebivolol (Bystolic)",
            "Bisoprolol (Zebeta)",
            "Carvedilol (Coreg)",
            "Propranolol (Inderal)",
            "Prazosin (Minipress)",
            "Hydralazine (Apresoline)",
            "Methyldopa (Aldomet)",
            "Reserpine (Serpasil)"
        ],
        "scorer": "gpt-4o",
        "judgement": {
            "matches": [
                "Lisinopril (Prinivil, Zestril)",
                "Hydrochlorothiazide (HCTZ)",
                "Losartan (Cozaar)",
                "Atenolol (Tenormin)",
                "Ramipril (Altace)",
                "Valsartan (Diovan)",
                "Diltiazem (Cardizem, Tiazac)",
                "Chlorthalidone",
                "Spironolactone (Aldactone)",
                "Furosemide (Lasix)",
                "Telmisartan (Micardis)",
                "Nebivolol (Bystolic)",
                "Carvedilol (Coreg)",
                "Propranolol (Inderal)",
                "Prazosin (Minipress)",
                "Hydralazine (Apresoline)",
                "Methyldopa (Aldomet)",
                "Reserpine (Serpasil)"
            ],
            "mismatches": [
                "Amlodipine (Norvasc)",
                "Metoprolol (Lopressor, Toprol XL)",
                "Verapamil (Calan, Verelan)",
                "Enapril (Vasotec)",
                "Olmesartan (Benicar)",
                "Bisoprolol (Zebeta)"
            ],
            "true_referents": [
                "ATENOLOL",
                "Alacepril",
                "Amlodipine + Valsartan",
                "Atenolol",
                "BISOPROLOL FUMARATE",
                "Bisoprolol fumarate",
                "Bunazosin",
                "CAPTOPRIL",
                "CARVEDILOL",
                "CARVEDILOL PHOSPHATE",
                "CHLOROTHIAZIDE",
                "CHLORTHALIDONE",
                "Candesartan + Chlorthalidone",
                "Carvedilol",
                "Chlorthalidone",
                "DILTIAZEM HYDROCHLORIDE",
                "Delapril",
                "Diltiazem hydrochloride",
                "Enalaprilat",
                "FELODIPINE",
                "FUROSEMIDE",
                "Furosemide",
                "HYDRALAZINE",
                "HYDRALAZINE HYDROCHLORIDE",
                "HYDROCHLOROTHIAZIDE",
                "Hydralazine hydrochloride",
                "Hydrochlorothiazide",
                "Indenolol",
                "LISINOPRIL",
                "LOSARTAN POTASSIUM",
                "Levamlodipine",
                "Lisinopril",
                "Losartan potassium",
                "Losartan potassium + Hydrochlorothiazide",
                "METHYLDOPA",
                "Mepindolol",
                "Methyl-DOPA",
                "Metoprolol",
                "NEBIVOLOL HYDROCHLORIDE",
                "Nebivolol",
                "Nebivolol + valsartan",
                "Nilvadipine",
                "Nimodipine",
                "OLMESARTAN MEDOXOMIL",
                "PRAZOSIN",
                "PRAZOSIN HYDROCHLORIDE",
                "PROPRANOLOL HYDROCHLORIDE",
                "Perindopril",
                "Propranolol hydrochloride",
                "RAMIPRIL",
                "RESERPINE",
                "Ramipril",
                "Reserpine",
                "Riodipine",
                "SPIRONOLACTONE",
                "Spironolactone",
                "Spironolactone+Furosemide",
                "Spirorenone",
                "TELMISARTAN",
                "Talinolol",
                "Telmisartan",
                "Telmisartan + Ramipril",
                "Teoprolol",
                "Toliprolol",
                "VALSARTAN",
                "VERAPAMIL HYDROCHLORIDE",
                "Valsartan",
                "Verapamil Hydrochloride"
            ],
            "TP": 18,
            "FP": 6,
            "FN": 0
        }
    },
    {
        "test": "limited-list-referents",
        "responder": "gpt-4o",
        "concept": "approved drug for hypertension",
        "domain": "medicine",
        "response": [
            "Lisinopril (LIS)",
            "Amlodipine (AML)",
            "Losartan (LOS)",
            "Hydrochlorothiazide (HCTZ)",
            "Metoprolol (MET)",
            "Valsartan (VAL)",
            "Diltiazem (DIL)",
            "Enalapril (ENA)",
            "Furosemide (FUR)",
            "Atenolol (ATN)",
            "Ramipril (RAM)",
            "Nifedipine (NIF)",
            "Carvedilol (CAR)",
            "Benazepril (BEN)",
            "Chlorthalidone (CHL)",
            "Irbesartan (IRB)",
            "Spironolactone (SPI)",
            "Propranolol (PRO)",
            "Telmisartan (TEL)",
            "Bisoprolol (BIS)",
            "Verapamil (VER)",
            "Captopril (CAP)",
            "Clonidine (CLO)",
            "Nebivolol (NEB)"
        ],
        "scorer": "gpt-4o",
        "judgement": {
            "matches": [
                "Lisinopril",
                "Amlodipine",
                "Hydrochlorothiazide",
                "Metoprolol",
                "Valsartan",
                "Diltiazem",
                "Enalapril",
                "Furosemide",
                "Atenolol",
                "Ramipril",
                "Nifedipine",
                "Carvedilol",
                "Benazepril",
                "Chlorthalidone",
                "Irbesartan",
                "Spironolactone",
                "Propranolol",
                "Telmisartan",
                "Bisoprolol",
                "Verapamil",
                "Captopril",
                "Clonidine",
                "Nebivolol"
            ],
            "mismatches": [
                "Losartan"
            ],
            "true_referents": [
                "AMLODIPINE BESYLATE",
                "ATENOLOL",
                "Amlodipine + Valsartan",
                "Amlodipine Besylate",
                "Amlodipine Besylate + Benazepril Hydrochloride",
                "Atenolol",
                "BENAZEPRIL HYDROCHLORIDE",
                "BISOPROLOL FUMARATE",
                "Benazepril Hydrochloride",
                "Bisoprolol fumarate",
                "CAPTOPRIL",
                "CARVEDILOL",
                "CARVEDILOL PHOSPHATE",
                "CHLOROTHIAZIDE",
                "CHLORTHALIDONE",
                "CLONIDINE",
                "CLONIDINE HYDROCHLORIDE",
                "Candesartan + Chlorthalidone",
                "Captopril",
                "Carvedilol",
                "Chlorthalidone",
                "Clonidine",
                "DILTIAZEM HYDROCHLORIDE",
                "Diltiazem hydrochloride",
                "ENALAPRIL MALEATE",
                "Enalapril maleate",
                "Enalaprilat",
                "FUROSEMIDE",
                "Furosemide",
                "HYDROCHLOROTHIAZIDE",
                "Hydrochlorothiazide",
                "IRBESARTAN",
                "Indenolol",
                "Irbesartan",
                "Irbesartan + Amlodipine",
                "LISINOPRIL",
                "LOSARTAN POTASSIUM",
                "Levamlodipine",
                "Lisinopril",
                "Losartan potassium",
                "Losartan potassium + Hydrochlorothiazide",
                "METOPROLOL TARTRATE",
                "Metoprolol",
                "Moprolol",
                "NEBIVOLOL HYDROCHLORIDE",
                "NIFEDIPINE",
                "Nebivolol",
                "Nebivolol + valsartan",
                "Nifedipine",
                "Nimodipine",
                "PROPRANOLOL HYDROCHLORIDE",
                "Perindopril",
                "Propranolol hydrochloride",
                "RAMIPRIL",
                "Ramipril",
                "SPIRONOLACTONE",
                "Spironolactone",
                "Spironolactone+Furosemide",
                "Spirorenone",
                "TELMISARTAN",
                "Telmisartan",
                "Telmisartan + Ramipril",
                "Teoprolol",
                "VALSARTAN",
                "VERAPAMIL HYDROCHLORIDE",
                "Valsartan",
                "Verapamil Hydrochloride"
            ],
            "TP": 23,
            "FP": 1,
            "FN": 0
        }
    },
    {
        "test": "limited-list-referents",
        "responder": "gpt-4o-mini",
        "concept": "approved drug for hypertension",
        "domain": "medicine",
        "response": [
            "Amlodipine (AMLO)",
            "Lisinopril (LIS)",
            "Losartan (LOS)",
            "Valsartan (VAL)",
            "Hydrochlorothiazide (HCTZ)",
            "Metoprolol (MET)",
            "Diltiazem (DILT)",
            "Carvedilol (CARV)",
            "Nifedipine (NIF)",
            "Enalapril (ENA)",
            "Olmesartan (OLM)",
            "Telmisartan (TEL)",
            "Propranolol (PRO)",
            "Bisoprolol (BISO)",
            "Ramipril (RAM)",
            "Clonidine (CLON)",
            "Spironolactone (SPIR)",
            "Hydralazine (HYD)",
            "Chlorthalidone (CHLOR)",
            "Furosemide (FURO)",
            "Atenolol (ATEN)",
            "Sotalol (SOT)",
            "Verapamil (VERA)",
            "Doxazosin (DOX)"
        ],
        "scorer": "gpt-4o",
        "judgement": {
            "matches": [
                "Lisinopril",
                "Valsartan",
                "Hydrochlorothiazide",
                "Metoprolol",
                "Diltiazem",
                "Carvedilol",
                "Nifedipine",
                "Enalapril",
                "Olmesartan medoxomil",
                "Telmisartan",
                "Propranolol hydrochloride",
                "Bisoprolol fumarate",
                "Ramipril",
                "Clonidine",
                "Spironolactone",
                "Hydralazine",
                "Chlorthalidone",
                "Furosemide",
                "Atenolol",
                "Sotalol hydrochloride",
                "Verapamil Hydrochloride",
                "Doxazosin"
            ],
            "mismatches": [
                "Amlodipine (AMLO)",
                "Losartan (LOS)"
            ],
            "true_referents": [
                "(S)-Doxazosin",
                "AMLODIPINE BESYLATE",
                "ATENOLOL",
                "Amlodipine + Valsartan",
                "Amlodipine Besylate",
                "Atenolol",
                "BISOPROLOL FUMARATE",
                "Bisoprolol fumarate",
                "Bupranolol",
                "CARVEDILOL",
                "CARVEDILOL PHOSPHATE",
                "CHLOROTHIAZIDE",
                "CHLORTHALIDONE",
                "CLONIDINE",
                "CLONIDINE HYDROCHLORIDE",
                "Candesartan + Chlorthalidone",
                "Carvedilol",
                "Chlorthalidone",
                "Clonidine",
                "DILTIAZEM HYDROCHLORIDE",
                "DOXAZOSIN",
                "DOXAZOSIN MESYLATE",
                "Diltiazem hydrochloride",
                "ENALAPRIL MALEATE",
                "Enalapril maleate",
                "Enalaprilat",
                "FUROSEMIDE",
                "Furosemide",
                "HYDRALAZINE",
                "HYDRALAZINE HYDROCHLORIDE",
                "HYDROCHLOROTHIAZIDE",
                "Hydralazine hydrochloride",
                "Hydrochlorothiazide",
                "LISINOPRIL",
                "LOSARTAN POTASSIUM",
                "Levamlodipine",
                "Lisinopril",
                "Losartan potassium",
                "Losartan potassium + Hydrochlorothiazide",
                "METOPROLOL TARTRATE",
                "Metoprolol",
                "Moprolol",
                "NIFEDIPINE",
                "Nifedipine",
                "Nimodipine",
                "OLMESARTAN MEDOXOMIL",
                "Olmesartan medoxomil",
                "PROPRANOLOL HYDROCHLORIDE",
                "Perindopril",
                "Propranolol hydrochloride",
                "RAMIPRIL",
                "Ramipril",
                "SPIRONOLACTONE",
                "Sotalol hydrochloride",
                "Spironolactone",
                "Spironolactone+Furosemide",
                "Spirorenone",
                "TELMISARTAN",
                "Telmisartan",
                "Telmisartan + Ramipril",
                "Teoprolol",
                "Tolamolol",
                "VALSARTAN",
                "VERAPAMIL HYDROCHLORIDE",
                "Valsartan",
                "Verapamil Hydrochloride"
            ],
            "TP": 22,
            "FP": 2,
            "FN": 0
        }
    },
    {
        "test": "limited-list-referents",
        "responder": "gpt-4-32k",
        "concept": "approved drug for hypertension",
        "domain": "medicine",
        "response": [
            "Lisinopril (Prinivil)",
            "Amlodipine (Norvasc)",
            "Losartan (Cozaar)",
            "Hydrochlorothiazide (Microzide)",
            "Metoprolol (Lopressor)",
            "Valsartan (Diovan)",
            "Atenolol (Tenormin)",
            "Ramipril (Altace)",
            "Furosemide (Lasix)",
            "Enalapril (Vasotec)",
            "Captopril (Capoten)",
            "Irbesartan (Avapro)",
            "Olmesartan (Benicar)",
            "Propranolol (Inderal)",
            "Telmisartan (Micardis)",
            "Quinapril (Accupril)",
            "Bisoprolol (Zebeta)",
            "Nifedipine (Adalat)",
            "Carvedilol (Coreg)",
            "Spironolactone (Aldactone)",
            "Clonidine (Catapres)",
            "Nebivolol (Bystolic)",
            "Terazosin (Hytrin)",
            "Diltiazem (Cardizem)"
        ],
        "scorer": "gpt-4o",
        "judgement": {
            "matches": [
                "Lisinopril",
                "Amlodipine",
                "Losartan potassium",
                "Hydrochlorothiazide",
                "Metoprolol",
                "Valsartan",
                "Atenolol",
                "Ramipril",
                "Furosemide",
                "Enalapril maleate",
                "Captopril",
                "Irbesartan",
                "Olmesartan medoxomil",
                "Propranolol hydrochloride",
                "Telmisartan",
                "Quinapril hydrochloride",
                "Bisoprolol fumarate",
                "Nifedipine",
                "Carvedilol",
                "Spironolactone",
                "Clonidine",
                "Nebivolol",
                "Diltiazem hydrochloride"
            ],
            "mismatches": [
                "Terazosin"
            ],
            "true_referents": [
                "ATENOLOL",
                "Alacepril",
                "Amlodipine + Valsartan",
                "Atenolol",
                "BISOPROLOL FUMARATE",
                "Bisoprolol fumarate",
                "Bunazosin",
                "CAPTOPRIL",
                "CARVEDILOL",
                "CARVEDILOL PHOSPHATE",
                "CHLOROTHIAZIDE",
                "CLONIDINE",
                "CLONIDINE HYDROCHLORIDE",
                "Captopril",
                "Carvedilol",
                "Clonidine",
                "DILTIAZEM HYDROCHLORIDE",
                "Diltiazem hydrochloride",
                "ENALAPRIL MALEATE",
                "Enalapril maleate",
                "Enalaprilat",
                "FELODIPINE",
                "FUROSEMIDE",
                "Furosemide",
                "HYDROCHLOROTHIAZIDE",
                "Hydrochlorothiazide",
                "IRBESARTAN",
                "Indenolol",
                "Irbesartan",
                "Irbesartan + Amlodipine",
                "LISINOPRIL",
                "LOSARTAN POTASSIUM",
                "Levamlodipine",
                "Lisinopril",
                "Losartan potassium",
                "Losartan potassium + Hydrochlorothiazide",
                "Metoprolol",
                "NEBIVOLOL HYDROCHLORIDE",
                "NIFEDIPINE",
                "Nebivolol",
                "Nebivolol + valsartan",
                "Nifedipine",
                "Nilvadipine",
                "Nimodipine",
                "OLMESARTAN MEDOXOMIL",
                "PRAZOSIN",
                "PROPRANOLOL HYDROCHLORIDE",
                "Propranolol hydrochloride",
                "QUINAPRIL HYDROCHLORIDE",
                "Quinapril hydrochloride",
                "RAMIPRIL",
                "Ramipril",
                "SPIRONOLACTONE",
                "Spironolactone",
                "Spironolactone+Furosemide",
                "Spirorenone",
                "TELMISARTAN",
                "Talinolol",
                "Telmisartan",
                "Telmisartan + Ramipril",
                "Teoprolol",
                "Toliprolol",
                "Trimazosin",
                "VALSARTAN",
                "Valsartan"
            ],
            "TP": 23,
            "FP": 1,
            "FN": 0
        }
    },
    {
        "test": "limited-list-referents",
        "responder": "gpt-35-turbo-16k",
        "concept": "approved drug for hypertension",
        "domain": "medicine",
        "response": [
            "Lisinopril (Prinivil, Zestril)",
            "Amlodipine (Norvasc)",
            "Metoprolol (Lopressor, Toprol XL)",
            "Losartan (Cozaar)",
            "Hydrochlorothiazide (Microzide)",
            "Atenolol (Tenormin)",
            "Valsartan (Diovan)",
            "Carvedilol (Coreg)",
            "Furosemide (Lasix)",
            "Bisoprolol (Zebeta)",
            "Spironolactone (Aldactone)",
            "Doxazosin (Cardura)",
            "Chlorthalidone (Hygroton)",
            "Propranolol (Inderal)",
            "Enalapril (Vasotec)",
            "Verapamil (Calan, Verelan)",
            "Clonidine (Catapres)",
            "Nifedipine (Procardia)",
            "Diltiazem (Cardizem)",
            "Irbesartan (Avapro)",
            "Quinapril (Accupril)",
            "Ramipril (Altace)",
            "Perindopril (Aceon)",
            "Eplerenone (Inspra)",
            "Olmesartan (Benicar)"
        ],
        "scorer": "gpt-4o",
        "judgement": {
            "matches": [
                "Lisinopril",
                "Amlodipine",
                "Metoprolol",
                "Losartan potassium",
                "Hydrochlorothiazide",
                "Atenolol",
                "Valsartan",
                "Carvedilol",
                "Furosemide",
                "Bisoprolol fumarate",
                "Spironolactone",
                "Doxazosin",
                "Chlorthalidone",
                "Propranolol hydrochloride",
                "Enalapril maleate",
                "Verapamil Hydrochloride",
                "Clonidine",
                "Nifedipine",
                "Diltiazem hydrochloride",
                "Irbesartan",
                "Quinapril hydrochloride",
                "Ramipril",
                "Perindopril",
                "Eplerenone"
            ],
            "mismatches": [
                "Olmesartan (Benicar)"
            ],
            "true_referents": [
                "(S)-Doxazosin",
                "ATENOLOL",
                "Alacepril",
                "Amlodipine + Valsartan",
                "Atenolol",
                "BISOPROLOL FUMARATE",
                "Bisoprolol fumarate",
                "CARVEDILOL",
                "CARVEDILOL PHOSPHATE",
                "CHLOROTHIAZIDE",
                "CHLORTHALIDONE",
                "CLONIDINE",
                "CLONIDINE HYDROCHLORIDE",
                "Candesartan + Chlorthalidone",
                "Carvedilol",
                "Chlorthalidone",
                "Clonidine",
                "DILTIAZEM HYDROCHLORIDE",
                "DOXAZOSIN",
                "DOXAZOSIN MESYLATE",
                "Diltiazem hydrochloride",
                "ENALAPRIL MALEATE",
                "EPLERENONE",
                "Enalapril maleate",
                "Enalaprilat",
                "Eplerenone",
                "FELODIPINE",
                "FUROSEMIDE",
                "Furosemide",
                "HYDROCHLOROTHIAZIDE",
                "Hydrochlorothiazide",
                "IRBESARTAN",
                "Indenolol",
                "Irbesartan",
                "Irbesartan + Amlodipine",
                "LISINOPRIL",
                "LOSARTAN POTASSIUM",
                "Levamlodipine",
                "Lisinopril",
                "Losartan potassium",
                "Losartan potassium + Hydrochlorothiazide",
                "Metoprolol",
                "NIFEDIPINE",
                "Nifedipine",
                "Nilvadipine",
                "Nimodipine",
                "PERINDOPRIL ARGININE",
                "PROPRANOLOL HYDROCHLORIDE",
                "Perindopril",
                "Propranolol hydrochloride",
                "QUINAPRIL HYDROCHLORIDE",
                "Quinapril hydrochloride",
                "RAMIPRIL",
                "Ramipril",
                "SPIRONOLACTONE",
                "Spironolactone",
                "Spironolactone+Furosemide",
                "Spirorenone",
                "Talinolol",
                "Teoprolol",
                "Toliprolol",
                "VALSARTAN",
                "VERAPAMIL HYDROCHLORIDE",
                "Valsartan",
                "Verapamil Hydrochloride"
            ],
            "TP": 24,
            "FP": 1,
            "FN": 0
        }
    },
    {
        "test": "limited-list-referents",
        "responder": "o1-mini",
        "concept": "approved drug for hypertension",
        "domain": "medicine",
        "response": [
            "Lisinopril (LIS)",
            "Losartan (LOS)",
            "Amlodipine (AML)",
            "Metoprolol (MET)",
            "Hydrochlorothiazide (HCTZ)",
            "Furosemide (FUR)",
            "Valsartan (VAL)",
            "Enalapril (ENL)",
            "Diltiazem (DIL)",
            "Propranolol (PROP)",
            "Spironolactone (SPIR)",
            "Irbesartan (IRB)",
            "Bisoprolol (BISO)",
            "Candesartan (CAN)",
            "Clonidine (CLON)",
            "Telmisartan (TEL)",
            "Nifedipine (NIF)",
            "Carvedilol (CARV)",
            "Perindopril (PER)",
            "Indapamide (IND)",
            "Doxazosin (DOX)",
            "Eplerenone (EPL)",
            "Aliskiren (ALISK)",
            "Minoxidil (MINO)"
        ],
        "scorer": "gpt-4o",
        "judgement": {
            "matches": [
                "Lisinopril",
                "Losartan potassium",
                "Amlodipine Besylate",
                "Metoprolol",
                "Hydrochlorothiazide",
                "Furosemide",
                "Valsartan",
                "Enalapril maleate",
                "Diltiazem hydrochloride",
                "Propranolol hydrochloride",
                "Spironolactone",
                "Irbesartan",
                "Bisoprolol fumarate",
                "Candesartan cilexetil",
                "Clonidine",
                "Telmisartan",
                "Nifedipine",
                "Carvedilol",
                "Perindopril",
                "Indapamide",
                "Doxazosin",
                "Eplerenone",
                "Aliskiren Fumarate"
            ],
            "mismatches": [
                "Minoxidil"
            ],
            "true_referents": [
                "(S)-Doxazosin",
                "ALISKIREN FUMARATE",
                "AMLODIPINE BESYLATE",
                "Aliskiren Fumarate",
                "Aliskiren Fumarate + Amlodipine Besylate",
                "Amlodipine + Valsartan",
                "Amlodipine Besylate",
                "BISOPROLOL FUMARATE",
                "Bisoprolol fumarate",
                "CANDESARTAN CILEXETIL",
                "CARVEDILOL",
                "CARVEDILOL PHOSPHATE",
                "CHLOROTHIAZIDE",
                "CLONIDINE",
                "CLONIDINE HYDROCHLORIDE",
                "Candesartan",
                "Candesartan cilexetil",
                "Carvedilol",
                "Clonidine",
                "DILTIAZEM HYDROCHLORIDE",
                "DOXAZOSIN",
                "DOXAZOSIN MESYLATE",
                "Diltiazem hydrochloride",
                "ENALAPRIL MALEATE",
                "EPLERENONE",
                "Enalapril maleate",
                "Enalaprilat",
                "Eplerenone",
                "Epoprostenol",
                "FUROSEMIDE",
                "Furosemide",
                "HYDROCHLOROTHIAZIDE",
                "Hydrochlorothiazide",
                "INDAPAMIDE",
                "IRBESARTAN",
                "Indanidine",
                "Indapamide",
                "Irbesartan",
                "Irbesartan + Amlodipine",
                "LISINOPRIL",
                "LOSARTAN POTASSIUM",
                "Levamlodipine",
                "Lisinopril",
                "Losartan potassium",
                "Losartan potassium + Hydrochlorothiazide",
                "METOPROLOL TARTRATE",
                "MINOXIDIL",
                "Metoprolol",
                "Moprolol",
                "NIFEDIPINE",
                "Nifedipine",
                "Nimodipine",
                "PROPRANOLOL HYDROCHLORIDE",
                "Perindopril",
                "Propranolol hydrochloride",
                "SPIRONOLACTONE",
                "Spironolactone",
                "Spironolactone+Furosemide",
                "Spirorenone",
                "TADALAFIL",
                "TELMISARTAN",
                "Tadalafil",
                "Telmisartan",
                "Telmisartan + Ramipril",
                "Teoprolol",
                "VALSARTAN",
                "Valsartan"
            ],
            "TP": 23,
            "FP": 1,
            "FN": 0
        }
    },
    {
        "test": "limited-list-referents",
        "responder": "anthropic.claude-3-5-sonnet-v1:0",
        "concept": "approved drug for hypertension",
        "domain": "medicine",
        "response": [
            "Lisinopril (Prinivil, Zestril)",
            "Amlodipine (Norvasc)",
            "Metoprolol (Lopressor, Toprol-XL)",
            "Hydrochlorothiazide (HCTZ)",
            "Losartan (Cozaar)",
            "Valsartan (Diovan)",
            "Atenolol (Tenormin)",
            "Enalapril (Vasotec)",
            "Furosemide (Lasix)",
            "Ramipril (Altace)",
            "Nifedipine (Procardia, Adalat)",
            "Carvedilol (Coreg)",
            "Olmesartan (Benicar)",
            "Telmisartan (Micardis)",
            "Diltiazem (Cardizem)",
            "Verapamil (Calan, Verelan)",
            "Spironolactone (Aldactone)",
            "Clonidine (Catapres)",
            "Irbesartan (Avapro)",
            "Propranolol (Inderal)",
            "Candesartan (Atacand)",
            "Bisoprolol (Zebeta)",
            "Doxazosin (Cardura)",
            "Felodipine (Plendil)"
        ],
        "scorer": "gpt-4o",
        "judgement": {
            "matches": [
                "Lisinopril",
                "Amlodipine",
                "Metoprolol",
                "Hydrochlorothiazide",
                "Losartan potassium",
                "Valsartan",
                "Atenolol",
                "Enalapril maleate",
                "Furosemide",
                "Ramipril",
                "Nifedipine",
                "Carvedilol",
                "Olmesartan medoxomil",
                "Telmisartan",
                "Diltiazem hydrochloride",
                "Verapamil Hydrochloride",
                "Spironolactone",
                "Clonidine",
                "Irbesartan",
                "Propranolol hydrochloride",
                "Candesartan",
                "Bisoprolol fumarate",
                "Doxazosin",
                "Felodipine"
            ],
            "mismatches": [],
            "true_referents": [
                "(S)-Doxazosin",
                "ATENOLOL",
                "Alacepril",
                "Amlodipine + Valsartan",
                "Atacand Plus",
                "Atenolol",
                "BISOPROLOL FUMARATE",
                "Bisoprolol fumarate",
                "CARVEDILOL",
                "CARVEDILOL PHOSPHATE",
                "CHLOROTHIAZIDE",
                "CLONIDINE",
                "CLONIDINE HYDROCHLORIDE",
                "Candesartan",
                "Carvedilol",
                "Clonidine",
                "DILTIAZEM HYDROCHLORIDE",
                "DOXAZOSIN",
                "DOXAZOSIN MESYLATE",
                "Diltiazem hydrochloride",
                "ENALAPRIL MALEATE",
                "Enalapril maleate",
                "Enalaprilat",
                "FELODIPINE",
                "FUROSEMIDE",
                "Felodipine",
                "Furosemide",
                "HYDROCHLOROTHIAZIDE",
                "Hydrochlorothiazide",
                "IRBESARTAN",
                "Indenolol",
                "Irbesartan",
                "Irbesartan + Amlodipine",
                "LISINOPRIL",
                "LOSARTAN POTASSIUM",
                "Levamlodipine",
                "Lisinopril",
                "Losartan potassium",
                "Losartan potassium + Hydrochlorothiazide",
                "Metoprolol",
                "NIFEDIPINE",
                "Nifedipine",
                "Nilvadipine",
                "Nimodipine",
                "OLMESARTAN MEDOXOMIL",
                "PROPRANOLOL HYDROCHLORIDE",
                "Perindopril",
                "Propranolol hydrochloride",
                "RAMIPRIL",
                "Ramipril",
                "SPIRONOLACTONE",
                "Spironolactone",
                "Spironolactone+Furosemide",
                "Spirorenone",
                "TELMISARTAN",
                "Talinolol",
                "Telmisartan",
                "Telmisartan + Ramipril",
                "Teoprolol",
                "Toliprolol",
                "VALSARTAN",
                "VERAPAMIL HYDROCHLORIDE",
                "Valsartan",
                "Verapamil Hydrochloride"
            ],
            "TP": 24,
            "FP": 0,
            "FN": 0
        }
    },
    {
        "test": "limited-list-referents",
        "responder": "anthropic.claude-3-opus-v1:0",
        "concept": "approved drug for hypertension",
        "domain": "medicine",
        "response": [
            "Lisinopril (Prinivil, Zestril)",
            "Amlodipine (Norvasc)",
            "Losartan (Cozaar)",
            "Metoprolol (Lopressor, Toprol XL)",
            "Hydrochlorothiazide (Microzide)",
            "Valsartan (Diovan)",
            "Atenolol (Tenormin)",
            "Carvedilol (Coreg)",
            "Enalapril (Vasotec)",
            "Ramipril (Altace)",
            "Olmesartan (Benicar)",
            "Propranolol (Inderal)",
            "Diltiazem (Cardizem, Tiazac)",
            "Benazepril (Lotensin)",
            "Chlorthalidone (Thalitone)",
            "Verapamil (Calan, Verelan)",
            "Candesartan (Atacand)",
            "Irbesartan (Avapro)",
            "Clonidine (Catapres)",
            "Spironolactone (Aldactone)",
            "Telmisartan (Micardis)",
            "Nadolol (Corgard)",
            "Nebivolol (Bystolic)",
            "Bisoprolol (Zebeta)"
        ],
        "scorer": "gpt-4o",
        "judgement": {
            "matches": [
                "Lisinopril",
                "Amlodipine",
                "Losartan potassium",
                "Metoprolol",
                "Hydrochlorothiazide",
                "Valsartan",
                "Atenolol",
                "Carvedilol",
                "Enalapril maleate",
                "Ramipril",
                "Olmesartan medoxomil",
                "Propranolol hydrochloride",
                "Diltiazem hydrochloride",
                "Benazepril Hydrochloride",
                "Chlorthalidone",
                "Verapamil Hydrochloride",
                "Candesartan",
                "Irbesartan",
                "Clonidine",
                "Spironolactone",
                "Telmisartan",
                "Nadolol",
                "Nebivolol",
                "Bisoprolol fumarate"
            ],
            "mismatches": [],
            "true_referents": [
                "ATENOLOL",
                "Alacepril",
                "Amlodipine + Valsartan",
                "Amlodipine Besylate + Benazepril Hydrochloride",
                "Atacand Plus",
                "Atenolol",
                "BENAZEPRIL HYDROCHLORIDE",
                "BISOPROLOL FUMARATE",
                "Benazepril Hydrochloride",
                "Bisoprolol fumarate",
                "CARVEDILOL",
                "CARVEDILOL PHOSPHATE",
                "CHLOROTHIAZIDE",
                "CHLORTHALIDONE",
                "CLONIDINE",
                "CLONIDINE HYDROCHLORIDE",
                "Candesartan",
                "Candesartan + Chlorthalidone",
                "Carvedilol",
                "Chlorthalidone",
                "Clonidine",
                "DILTIAZEM HYDROCHLORIDE",
                "Diltiazem hydrochloride",
                "ENALAPRIL MALEATE",
                "Enalapril maleate",
                "Enalaprilat",
                "FELODIPINE",
                "HYDROCHLOROTHIAZIDE",
                "Hydrochlorothiazide",
                "IRBESARTAN",
                "Indenolol",
                "Irbesartan",
                "Irbesartan + Amlodipine",
                "LISINOPRIL",
                "LOSARTAN POTASSIUM",
                "Levamlodipine",
                "Lisinopril",
                "Losartan potassium",
                "Losartan potassium + Hydrochlorothiazide",
                "Metoprolol",
                "NADOLOL",
                "NEBIVOLOL HYDROCHLORIDE",
                "Nadolol",
                "Nadoxolol",
                "Nebivolol",
                "Nebivolol + valsartan",
                "Nilvadipine",
                "Nimodipine",
                "OLMESARTAN MEDOXOMIL",
                "PROPRANOLOL HYDROCHLORIDE",
                "Perindopril",
                "Propranolol hydrochloride",
                "RAMIPRIL",
                "Ramipril",
                "SPIRONOLACTONE",
                "Spironolactone",
                "Spirorenone",
                "TELMISARTAN",
                "Talinolol",
                "Telmisartan",
                "Telmisartan + Ramipril",
                "Teoprolol",
                "Toliprolol",
                "VALSARTAN",
                "VERAPAMIL HYDROCHLORIDE",
                "Valsartan",
                "Verapamil Hydrochloride"
            ],
            "TP": 24,
            "FP": 0,
            "FN": 0
        }
    },
    {
        "test": "limited-list-referents",
        "responder": "anthropic.claude-3-sonnet-v1:0",
        "concept": "approved drug for hypertension",
        "domain": "medicine",
        "response": [
            "Lisinopril (LIS)",
            "Enalapril (ENA)",
            "Captopril (CAP)",
            "Losartan (LOS)",
            "Valsartan (VAL)",
            "Irbesartan (IRB)",
            "Amlodipine (AML)",
            "Nifedipine (NIF)",
            "Diltiazem (DIL)",
            "Verapamil (VER)",
            "Hydrochlorothiazide (HCTZ)",
            "Chlorthalidone (CHL)",
            "Indapamide (IND)",
            "Furosemide (FUR)",
            "Spironolactone (SPR)",
            "Eplerenone (EPL)",
            "Clonidine (CLO)",
            "Methyldopa (MET)",
            "Hydralazine (HYD)",
            "Minoxidil (MIN)",
            "Nebivolol (NEB)",
            "Carvedilol (CAR)",
            "Metoprolol (MET)",
            "Atenolol (ATE)"
        ],
        "scorer": "gpt-4o",
        "judgement": {
            "matches": [
                "Lisinopril",
                "Enalapril maleate",
                "Captopril",
                "Losartan potassium",
                "Valsartan",
                "Irbesartan",
                "Amlodipine Besylate",
                "Nifedipine",
                "Diltiazem hydrochloride",
                "Verapamil Hydrochloride",
                "Hydrochlorothiazide",
                "Chlorthalidone",
                "Indapamide",
                "Furosemide",
                "Spironolactone",
                "Eplerenone",
                "Clonidine",
                "Methyl-DOPA",
                "Hydralazine",
                "Minoxidil",
                "Nebivolol",
                "Carvedilol",
                "Metoprolol",
                "Atenolol"
            ],
            "mismatches": [],
            "true_referents": [
                "AMLODIPINE BESYLATE",
                "ATENOLOL",
                "Amlodipine + Valsartan",
                "Amlodipine Besylate",
                "Atenolol",
                "CAPTOPRIL",
                "CARVEDILOL",
                "CARVEDILOL PHOSPHATE",
                "CHLOROTHIAZIDE",
                "CHLORTHALIDONE",
                "CLONIDINE",
                "CLONIDINE HYDROCHLORIDE",
                "Candesartan + Chlorthalidone",
                "Captopril",
                "Carvedilol",
                "Chlorthalidone",
                "Clonidine",
                "DILTIAZEM HYDROCHLORIDE",
                "Diltiazem hydrochloride",
                "ENALAPRIL MALEATE",
                "EPLERENONE",
                "Enalapril maleate",
                "Enalaprilat",
                "Eplerenone",
                "Epoprostenol",
                "FUROSEMIDE",
                "Furosemide",
                "HYDRALAZINE",
                "HYDRALAZINE HYDROCHLORIDE",
                "HYDROCHLOROTHIAZIDE",
                "Hydralazine hydrochloride",
                "Hydrochlorothiazide",
                "INDAPAMIDE",
                "IRBESARTAN",
                "Indanidine",
                "Indapamide",
                "Indenolol",
                "Irbesartan",
                "Irbesartan + Amlodipine",
                "LISINOPRIL",
                "LOSARTAN POTASSIUM",
                "Levamlodipine",
                "Lisinopril",
                "Losartan potassium",
                "Losartan potassium + Hydrochlorothiazide",
                "METHYLDOPA",
                "METOPROLOL TARTRATE",
                "METYROSINE",
                "MINOXIDIL",
                "Methyl-DOPA",
                "Metoprolol",
                "NEBIVOLOL HYDROCHLORIDE",
                "NIFEDIPINE",
                "Nebivolol",
                "Nebivolol + valsartan",
                "Nifedipine",
                "Nimodipine",
                "Perindopril",
                "SPIRONOLACTONE",
                "Spironolactone",
                "Spironolactone+Furosemide",
                "Spirorenone",
                "TADALAFIL",
                "Tadalafil",
                "Teoprolol",
                "VALSARTAN",
                "VERAPAMIL HYDROCHLORIDE",
                "Valsartan",
                "Verapamil Hydrochloride"
            ],
            "TP": 24,
            "FP": 0,
            "FN": 0
        }
    },
    {
        "test": "limited-list-referents",
        "responder": "anthropic.claude-3-haiku-v1:0",
        "concept": "approved drug for hypertension",
        "domain": "medicine",
        "response": [
            "Amlodipine (AML)",
            "Atenolol (ATN)",
            "Benazepril (BNZ)",
            "Candesartan (CND)",
            "Captopril (CPT)",
            "Carvedilol (CVD)",
            "Chlorthalidone (CHT)",
            "Enalapril (ENA)",
            "Fosinopril (FSN)",
            "Hydrochlorothiazide (HCT)",
            "Irbesartan (IRB)",
            "Lisinopril (LIS)",
            "Losartan (LOS)",
            "Metoprolol (MET)",
            "Nifedipine (NIF)",
            "Olmesartan (OLM)",
            "Perindopril (PER)",
            "Pindolol (PIN)",
            "Quinapril (QUI)",
            "Ramipril (RAM)",
            "Telmisartan (TEL)",
            "Valsartan (VAL)",
            "Verapamil (VER)",
            "Zofenopril (ZOF)"
        ],
        "scorer": "gpt-4o",
        "judgement": {
            "matches": [
                "Atenolol",
                "Candesartan",
                "Captopril",
                "Carvedilol",
                "Chlorthalidone",
                "Hydrochlorothiazide",
                "Irbesartan",
                "Lisinopril",
                "Nifedipine",
                "Olmesartan medoxomil",
                "Ramipril",
                "Telmisartan",
                "Valsartan",
                "Verapamil Hydrochloride"
            ],
            "mismatches": [
                "Amlodipine (AML)",
                "Benazepril (BNZ)",
                "Enalapril (ENA)",
                "Fosinopril (FSN)",
                "Losartan (LOS)",
                "Metoprolol (MET)",
                "Perindopril (PER)",
                "Pindolol (PIN)",
                "Quinapril (QUI)",
                "Zofenopril (ZOF)"
            ],
            "true_referents": [
                "AMLODIPINE BESYLATE",
                "ATENOLOL",
                "Amlodipine + Valsartan",
                "Amlodipine Besylate",
                "Amlodipine Besylate + Benazepril Hydrochloride",
                "Atenolol",
                "BENAZEPRIL HYDROCHLORIDE",
                "Benazepril Hydrochloride",
                "CANDESARTAN CILEXETIL",
                "CAPTOPRIL",
                "CARVEDILOL",
                "CARVEDILOL PHOSPHATE",
                "CHLORTHALIDONE",
                "Candesartan",
                "Candesartan + Chlorthalidone",
                "Captopril",
                "Carvedilol",
                "Chlorothiazide",
                "Chlorthalidone",
                "ENALAPRIL MALEATE",
                "Enalapril maleate",
                "Enalaprilat",
                "FOSINOPRIL SODIUM",
                "Fosinopril sodium",
                "HYDROCHLOROTHIAZIDE",
                "Hydrochlorothiazide",
                "IRBESARTAN",
                "Imidapril",
                "Indenolol",
                "Irbesartan",
                "Irbesartan + Amlodipine",
                "LISINOPRIL",
                "LOSARTAN POTASSIUM",
                "Levamlodipine",
                "Lisinopril",
                "Losartan potassium",
                "Losartan potassium + Hydrochlorothiazide",
                "METOPROLOL TARTRATE",
                "Mepindolol",
                "Metoprolol",
                "NIFEDIPINE",
                "Nifedipine",
                "Nimodipine",
                "OLMESARTAN MEDOXOMIL",
                "Olmesartan medoxomil",
                "Penirolol",
                "Perindopril",
                "Pindolol",
                "QUINAPRIL HYDROCHLORIDE",
                "Quinapril hydrochloride",
                "RAMIPRIL",
                "Ramipril",
                "TELMISARTAN",
                "TRANDOLAPRIL",
                "Telmisartan",
                "Telmisartan + Ramipril",
                "Teoprolol",
                "Trandolapril",
                "VALSARTAN",
                "VERAPAMIL HYDROCHLORIDE",
                "Valsartan",
                "Verapamil Hydrochloride",
                "Zofenopril"
            ],
            "TP": 14,
            "FP": 10,
            "FN": 0
        }
    },
    {
        "test": "limited-list-referents",
        "responder": "meta.llama3-8b-instruct-v1:0",
        "concept": "approved drug for hypertension",
        "domain": "medicine",
        "response": [
            "Amlodipine (Norvasc)",
            "Atenolol (Tenormin)",
            "Bisoprolol (Zebeta)",
            "Captopril (Capoten)",
            "Enalapril (Vasotec)",
            "Felodipine (Plendil)",
            "Hydralazine (Apresoline)",
            "Indapamide (Lozol)",
            "Labetalol (Trandate)",
            "Lisinopril (Zestril)",
            "Losartan (Cozaar)",
            "Metoprolol (Lopressor)",
            "Methyldopa (Aldomet)",
            "Nifedipine (Adalat)",
            "Nimodipine (Nimotop)",
            "Prazosin (Minipress)",
            "Propranolol (Inderal)",
            "Ramipril (Altace)",
            "Telmisartan (Micardis)",
            "Valsartan (Diovan)",
            "Verapamil (Calan)",
            "Vasodilators (e.g. Nitroprusside)",
            "Hydrochlorothiazide (HCTZ)",
            "Spironolactone (Aldactone)",
            "Triamterene (Dyrenium)",
            "Eplerenone (Inspra)",
            "Aldosterone antagonists (e.g. Eplerenone)"
        ],
        "scorer": "gpt-4o",
        "judgement": {
            "matches": [
                "Atenolol",
                "Bisoprolol fumarate",
                "Captopril",
                "Enalapril maleate",
                "Felodipine",
                "Hydralazine hydrochloride",
                "Indapamide",
                "Labetalol hydrochloride",
                "Lisinopril",
                "Losartan potassium",
                "Metoprolol",
                "Methyl-DOPA",
                "Nifedipine",
                "Nimodipine",
                "Prazosin",
                "Propranolol hydrochloride",
                "Ramipril",
                "Telmisartan",
                "Valsartan",
                "Verapamil Hydrochloride",
                "Hydrochlorothiazide",
                "Spironolactone"
            ],
            "mismatches": [
                "Amlodipine (Norvasc)",
                "Vasodilators (e.g. Nitroprusside)",
                "Triamterene (Dyrenium)",
                "Eplerenone (Inspra)",
                "Aldosterone antagonists (e.g. Eplerenone)"
            ],
            "true_referents": [
                "ATENOLOL",
                "Alacepril",
                "Amlodipine + Valsartan",
                "Atenolol",
                "BISOPROLOL FUMARATE",
                "Bisoprolol fumarate",
                "Brinzolamide",
                "Bunazosin",
                "CAPTOPRIL",
                "CHLOROTHIAZIDE",
                "Captopril",
                "ENALAPRIL MALEATE",
                "Enalapril maleate",
                "Enalaprilat",
                "FELODIPINE",
                "Felodipine",
                "HYDRALAZINE",
                "HYDRALAZINE HYDROCHLORIDE",
                "HYDROCHLOROTHIAZIDE",
                "Hydralazine hydrochloride",
                "Hydrochlorothiazide",
                "INDAPAMIDE",
                "Indapamide",
                "Indenolol",
                "LABETALOL HYDROCHLORIDE",
                "LISINOPRIL",
                "LOSARTAN POTASSIUM",
                "Labetalol hydrochloride",
                "Levamlodipine",
                "Lisinopril",
                "Losartan potassium",
                "Losartan potassium + Hydrochlorothiazide",
                "METHYLDOPA",
                "Mepindolol",
                "Methyl-DOPA",
                "Metoprolol",
                "NIFEDIPINE",
                "NISOLDIPINE",
                "NITROGLYCERIN",
                "NITROPRUSSIDE",
                "Nifedipine",
                "Nilvadipine",
                "Nimodipine",
                "Nisoldipine",
                "Nitric oxide",
                "PRAZOSIN",
                "PRAZOSIN HYDROCHLORIDE",
                "PROPRANOLOL HYDROCHLORIDE",
                "Perindopril",
                "Propranolol hydrochloride",
                "RAMIPRIL",
                "Ramipril",
                "SPIRONOLACTONE",
                "Spironolactone",
                "Spirorenone",
                "TELMISARTAN",
                "Talinolol",
                "Telmisartan",
                "Telmisartan + Ramipril",
                "Teoprolol",
                "Tertatolol",
                "Toliprolol",
                "VALSARTAN",
                "VERAPAMIL HYDROCHLORIDE",
                "Valsartan",
                "Verapamil Hydrochloride"
            ],
            "TP": 22,
            "FP": 5,
            "FN": 0
        }
    },
    {
        "test": "limited-list-referents",
        "responder": "meta.llama3-70b-instruct-v1:0",
        "concept": "approved drug for hypertension",
        "domain": "medicine",
        "response": [
            "Accuretic (Quinapril + Hydrochlorothiazide)",
            "Amias (Amlodipine)",
            "Apo-Triazo (Triamterene + Hydrochlorothiazide)",
            "Azor (Amlodipine + Olmesartan)",
            "Bisobloc (Bisoprolol)",
            "Calan (Verapamil)",
            "Capozide (Captopril + Hydrochlorothiazide)",
            "Cardizem (Diltiazem)",
            "Co-Diovan (Valsartan + Hydrochlorothiazide)",
            "Coaprovel (Irbesartan + Hydrochlorothiazide)",
            "Diovan (Valsartan)",
            "Doxazosin",
            "Edarbi (Azilsartan)",
            "Exforge (Amlodipine + Valsartan)",
            "Hypovase (Prazosin)",
            "Hyzaar (Losartan + Hydrochlorothiazide)",
            "Inderal (Propranolol)",
            "Lotensin (Benazepril)",
            "Lotrel (Benazepril + Amlodipine)",
            "Metoprolol",
            "Minipress (Prazosin)",
            "Monopril (Fosinopril)",
            "Norvasc (Amlodipine)",
            "Tenoret (Atenolol + Chlorthalidone)",
            "Tenormin (Atenolol)",
            "Zestoretic (Lisinopril + Hydrochlorothiazide)",
            "Zestril (Lisinopril)"
        ],
        "scorer": "gpt-4o",
        "judgement": {
            "error": "JSON decode error: Expecting value: line 1 column 1 (char 0)",
            "true_referents": [
                "(S)-Doxazosin",
                "AMLODIPINE BENZOATE",
                "ATENOLOL",
                "Accuretic",
                "Amlodipine + Valsartan",
                "Amlodipine Besylate + Benazepril Hydrochloride",
                "Amlodipine Besylate + Hydrochlorothiazide + Valsartan",
                "Amlodipine Besylate + Olmesartan Medoxomil",
                "Amlodipine Besylate + Telmisartan",
                "Atenolol",
                "Azilsartan + Amlodipine Besilate",
                "BENAZEPRIL HYDROCHLORIDE",
                "BISOPROLOL FUMARATE",
                "Benazepril Hydrochloride",
                "Benazepril Hydrochloride + Hydrochlorothiazide",
                "Bisoprolol fumarate",
                "Bunazosin",
                "Butofilolol",
                "CARVEDILOL",
                "Co-diovan",
                "DILTIAZEM HYDROCHLORIDE",
                "DOXAZOSIN",
                "DOXAZOSIN MESYLATE",
                "Diltiazem hydrochloride",
                "Edarbi",
                "FOSINOPRIL SODIUM",
                "Felodipine",
                "Fosinopril sodium",
                "Gallopamil",
                "HYDROCHLOROTHIAZIDE",
                "Hydrochlorothiazide",
                "Hydrochlorothiazide + Lisinopril",
                "Hydrochlorothiazide + Telmisartan",
                "Imidapril",
                "Indenolol",
                "Irbesartan + Amlodipine",
                "Irbesartan + Trichlormethiazide",
                "Levamlodipine",
                "Losartan potassium + Hydrochlorothiazide",
                "Metoprolol",
                "Nilvadipine",
                "Nimodipine",
                "Olmesartan medoxomil + Chlorthalidone",
                "PRAZOSIN",
                "PRAZOSIN HYDROCHLORIDE",
                "PROPRANOLOL HYDROCHLORIDE",
                "Propranolol hydrochloride",
                "TELMISARTAN",
                "TRIAMTERENE",
                "Teoprolol",
                "Toliprolol",
                "Trimazosin",
                "VALSARTAN",
                "VERAPAMIL HYDROCHLORIDE",
                "Valsartan",
                "Valsartan + cilnidipine",
                "Verapamil Hydrochloride"
            ]
        }
    },
    {
        "test": "limited-list-referents",
        "responder": "amazon.titan-text-express-v1",
        "concept": "approved drug for hypertension",
        "domain": "medicine",
        "response": "error when calling model 'amazon.titan-text-express-v1': empty response",
        "scorer": "gpt-4o",
        "judgement": {
            "TP": 0,
            "FP": 0
        }
    }
]