[
    {
        "test": "limited-list-referents-from-selection-criteria",
        "responder": "qwen-v2.5-14b-instruct",
        "concept": "DNA restriction enzyme",
        "domain": "biology",
        "response": [
            "McrA (McrA)",
            "McrBC (McrBC)",
            "McrC (McrC)",
            "McrDC (McrDC)",
            "McrF (McrF)",
            "Mrr (Mrr)",
            "Cse4 (Cse4)",
            "Csy4 (Csy4)",
            "Csf1I (Csf1I)",
            "Mva12 (Mva12)",
            "Mva13 (Mva13)",
            "Mva14 (Mva14)",
            "NaeI (NaeI)",
            "NaeII (NaeII)",
            "NaeIII (NaeIII)",
            "NaeIV (NaeIV)",
            "NaeV (NaeV)",
            "NaeVI (NaeVI)",
            "NaeVII (NaeVII)",
            "NaeVIII (NaeVIII)",
            "NaeIX (NaeIX)",
            "NaeX (NaeX)",
            "NaeXI (NaeXI)"
        ],
        "scorer": "gpt-4o",
        "judgement": {
            "matches": [
                "NaeI"
            ],
            "mismatches": [
                "McrA",
                "McrBC",
                "McrC",
                "McrDC",
                "McrF",
                "Mrr",
                "Cse4",
                "Csy4",
                "Csf1I",
                "Mva12",
                "Mva13",
                "Mva14",
                "NaeII",
                "NaeIII",
                "NaeIV",
                "NaeV",
                "NaeVI",
                "NaeVII",
                "NaeVIII",
                "NaeIX",
                "NaeX",
                "NaeXI"
            ],
            "true_referents": [
                "",
                "AseII",
                "AviII",
                "Bsc4I",
                "Bse1I",
                "BseX3I",
                "BseXI",
                "BspLU4I",
                "BsrAI",
                "BsrBI",
                "BveI",
                "CcrI",
                "CfrBI",
                "CfrI",
                "HaeI",
                "HaeII",
                "HaeIII",
                "HaeIV",
                "HalII",
                "HpyC1I",
                "HpyF44III",
                "MaeIII",
                "MavI",
                "MchAI",
                "McrI",
                "MkrAI",
                "MroI",
                "Mva1269I",
                "MvaI",
                "MvrI",
                "NaeI",
                "NarI",
                "NlaIV",
                "NunII",
                "PaeI",
                "PovII",
                "SceIII",
                "Ssp1I",
                "StyD4I",
                "Tsp1I",
                "VpaK11AI"
            ],
            "TP": 1,
            "FP": 22,
            "FN": 0
        }
    },
    {
        "test": "limited-list-referents-from-selection-criteria",
        "responder": "phi-v4",
        "concept": "DNA restriction enzyme",
        "domain": "biology",
        "response": [
            "Type I Restriction Endonuclease (e.g., EcoRI)",
            "Type II Restriction Endonuclease (e.g., HindIII)",
            "Type III Restriction Endonuclease (e.g., EcoP15I)",
            "Type IV Restriction Endonuclease (e.g., MlyI)",
            "HsdR Subunit (part of Type I restriction-modification system)",
            "HsdM Subunit (part of Type I restriction-modification system)",
            "HsdS Subunit (part of Type I restriction-modification system)",
            "McrBC (Methyl-CpG Restriction Enzyme)",
            "McrA (part of the Type IIC restriction-modification system)",
            "McrB (part of the Type IIC restriction-modification system)",
            "McrC (part of the Type IIC restriction-modification system)",
            "McrD (part of the Type IIC restriction-modification system)",
            "McrG (part of the Type IIC restriction-modification system)",
            "McrGI (Type IIC Restriction Endonuclease)",
            "McrGII (Type IIC Restriction Endonuclease)",
            "McrGIII (Type IIC Restriction Endonuclease)",
            "McrGIV (Type IIC Restriction Endonuclease)",
            "McrGV (Type IIC Restriction Endonuclease)",
            "McrGI (Methyl-CpG Restriction Endonuclease)",
            "McrGII (Methyl-CpG Restriction Endonuclease)",
            "McrGIII (Methyl-CpG Restriction Endonuclease)",
            "McrGIV (Methyl-CpG Restriction Endonuclease)",
            "McrGV (Methyl-CpG Restriction Endonuclease)",
            "Klenow Fragment (exonuclease-deficient DNA polymerase I, used in conjunction with restriction enzymes)"
        ],
        "scorer": "gpt-4o",
        "judgement": {
            "matches": [
                "EcoRI",
                "HindIII",
                "EcoP15I",
                "MlyI"
            ],
            "mismatches": [
                "Type I Restriction Endonuclease (e.g., EcoRI)",
                "Type II Restriction Endonuclease (e.g., HindIII)",
                "Type III Restriction Endonuclease (e.g., EcoP15I)",
                "Type IV Restriction Endonuclease (e.g., MlyI)",
                "HsdR Subunit (part of Type I restriction-modification system)",
                "HsdM Subunit (part of Type I restriction-modification system)",
                "HsdS Subunit (part of Type I restriction-modification system)",
                "McrBC (Methyl-CpG Restriction Enzyme)",
                "McrA (part of the Type IIC restriction-modification system)",
                "McrB (part of the Type IIC restriction-modification system)",
                "McrC (part of the Type IIC restriction-modification system)",
                "McrD (part of the Type IIC restriction-modification system)",
                "McrG (part of the Type IIC restriction-modification system)",
                "McrGI (Type IIC Restriction Endonuclease)",
                "McrGII (Type IIC Restriction Endonuclease)",
                "McrGIII (Type IIC Restriction Endonuclease)",
                "McrGIV (Type IIC Restriction Endonuclease)",
                "McrGV (Type IIC Restriction Endonuclease)",
                "McrGI (Methyl-CpG Restriction Endonuclease)",
                "McrGII (Methyl-CpG Restriction Endonuclease)",
                "McrGIII (Methyl-CpG Restriction Endonuclease)",
                "McrGIV (Methyl-CpG Restriction Endonuclease)",
                "McrGV (Methyl-CpG Restriction Endonuclease)",
                "Klenow Fragment (exonuclease-deficient DNA polymerase I, used in conjunction with restriction enzymes)"
            ],
            "true_referents": [
                "",
                "AccIII",
                "AscI",
                "AsiI",
                "AvrBII",
                "Bse15I",
                "BseGI",
                "BsiI",
                "BsmI",
                "BspLU11I",
                "BspLU11III",
                "BsrGI",
                "CbrI",
                "CfrA4I",
                "CfrBI",
                "CfrJ4I",
                "DrdI",
                "EcoHK31I",
                "EcoP15I",
                "EcoRI",
                "EcoRII",
                "EcoRV",
                "HgiCII",
                "HgiCIII",
                "HgiHIII",
                "HindIII",
                "Hsp92I",
                "Hsp92II",
                "LlaG2I",
                "MaeIII",
                "MaeK81II",
                "McrI",
                "MlyI",
                "MspB4I",
                "SspD5I",
                "SspD5II",
                "Van91I"
            ],
            "TP": 4,
            "FP": 24,
            "FN": 0
        }
    },
    {
        "test": "limited-list-referents-from-selection-criteria",
        "responder": "mistral-small-instruct-24B",
        "concept": "DNA restriction enzyme",
        "domain": "biology",
        "response": [
            "Restriction endonuclease EcoRI (EcoRI)",
            "Restriction endonuclease BamHI (BamHI)",
            "Restriction endonuclease HindIII (HindIII)",
            "Restriction endonuclease PstI (PstI)",
            "Restriction endonuclease SalI (SalI)",
            "Restriction endonuclease XbaI (XbaI)",
            "Restriction endonuclease EcoRV (EcoRV)",
            "Restriction endonuclease NotI (NotI)",
            "Restriction endonuclease KpnI (KpnI)",
            "Restriction endonuclease SmaI (SmaI)",
            "Restriction endonuclease AvaI (AvaI)",
            "Restriction endonuclease BglII (BglII)",
            "Restriction endonuclease ClaI (ClaI)",
            "Restriction endonuclease DraI (DraI)",
            "Restriction endonuclease HaeIII (HaeIII)",
            "Restriction endonuclease MluI (MluI)",
            "Restriction endonuclease NdeI (NdeI)",
            "Restriction endonuclease NheI (NheI)",
            "Restriction endonuclease SpeI (SpeI)",
            "Restriction endonuclease XhoI (XhoI)",
            "Restriction endonuclease SacI (SacI)",
            "Restriction endonuclease SphI (SphI)",
            "Restriction endonuclease StuI (StuI)",
            "Restriction endonuclease ApaI (ApaI)"
        ],
        "scorer": "gpt-4o",
        "judgement": {
            "matches": [
                "EcoRI",
                "BamHI",
                "HindIII",
                "PstI",
                "SalI",
                "XbaI",
                "EcoRV",
                "KpnI",
                "SmaI",
                "AvaI",
                "BglII",
                "ClaI",
                "DraI",
                "HaeIII",
                "MluI",
                "NdeI",
                "NheI",
                "SpeI",
                "XhoI",
                "SacI",
                "SphI",
                "StuI",
                "ApaI"
            ],
            "mismatches": [
                "NotI"
            ],
            "true_referents": [
                "ApaI",
                "AvaI",
                "AvaII",
                "AvcI",
                "BamHI",
                "BamNII",
                "BglI",
                "BglII",
                "BliAI",
                "BshI",
                "ClaI",
                "DraI",
                "DraIII",
                "DriI",
                "EcoICRI",
                "EcoR124II",
                "EcoRI",
                "EcoRII",
                "EcoRV",
                "ErhB9I",
                "FbaI",
                "GstI",
                "HaeII",
                "HaeIII",
                "HgiHIII",
                "HindII",
                "HindIII",
                "HpaI",
                "Kpn2I",
                "Kpn2kI",
                "KpnI",
                "MfeI",
                "Mlu23I",
                "MluI",
                "MluNI",
                "NaeI",
                "NciI",
                "NcoI",
                "NdeI",
                "NdeII",
                "NheI",
                "NopI",
                "NspI",
                "PceI",
                "PlaI",
                "PstI",
                "SacI",
                "SacII",
                "SacNI",
                "SalI",
                "SalPI",
                "ScaI",
                "SmaI",
                "SmiI",
                "SpeI",
                "SphI",
                "SplI",
                "SpmI",
                "SteI",
                "StsI",
                "StuI",
                "XbaI",
                "XhoI",
                "XhoII",
                "XpaI"
            ],
            "TP": 23,
            "FP": 1,
            "FN": 0
        }
    },
    {
        "test": "limited-list-referents-from-selection-criteria",
        "responder": "gemma-3",
        "concept": "DNA restriction enzyme",
        "domain": "biology",
        "response": [
            "EcoKI (EcoKI)",
            "EcoRII (EcoRII)",
            "EcoRI (EcoRI)",
            "HindII (HindII)",
            "HgaI (HgaI)",
            "MboI (MboI)",
            "Sau3AI (Sau3AI)",
            "SmaI (SmaI)",
            "XmaI (XmaI)",
            "BsuRI (BsuRI)",
            "BcgI (BcgI)",
            "BspT6I (BspT6I)",
            "ApoI (ApoI)",
            "PstI (PstI - sometimes exhibits this activity)",
            "SphI (SphI - under specific conditions)",
            "NotI (NotI - can show this behavior)",
            "DpnI (DpnI)",
            "TaqI (TaqI)",
            "MspI (MspI)",
            "HpaII (HpaII)",
            "AluI (AluI)",
            "RsaI (RsaI)",
            "PvuII (PvuII)",
            "BssHII (BssHII)"
        ],
        "scorer": "gpt-4o",
        "judgement": {
            "matches": [
                "EcoRII",
                "EcoRI",
                "HindII",
                "HgaI",
                "MboI",
                "Sau3AI",
                "SmaI",
                "XmaI",
                "BsuRI",
                "BcgI",
                "ApoI",
                "PstI",
                "SphI",
                "NotI",
                "DpnI",
                "TaqI",
                "MspI",
                "HpaII",
                "AluI",
                "RsaI",
                "PvuII",
                "BssHII"
            ],
            "mismatches": [
                "EcoKI",
                "BspT6I"
            ],
            "true_referents": [
                "",
                "AauI",
                "AluI",
                "ApoI",
                "AspNI",
                "AsuI",
                "BanI",
                "BcgI",
                "BcoI",
                "BsgI",
                "BshI",
                "Bsp6I",
                "BspD6I",
                "BspKT6I",
                "BssHI",
                "BssHII",
                "Bsu23I",
                "Bsu6I",
                "BsuRI",
                "BtgI",
                "DpnI",
                "DpnII",
                "DsaI",
                "Eco13kI",
                "Eco21kI",
                "Eco29kI",
                "EcoICRI",
                "EcoRI",
                "EcoRII",
                "EcoVIII",
                "HgaI",
                "HgiAI",
                "HgiHIII",
                "HindII",
                "HindIII",
                "HpaI",
                "HpaII",
                "MboI",
                "MboII",
                "MspI",
                "NopI",
                "NotI",
                "PfaAII",
                "PhoI",
                "PstI",
                "PvuI",
                "PvuII",
                "RsaI",
                "Sau3AI",
                "Sau96I",
                "SauI",
                "ScaI",
                "SmaI",
                "SphI",
                "SplI",
                "SpmI",
                "SspI",
                "SwaI",
                "TaqI",
                "TaqII",
                "TaqXI",
                "TspDTI",
                "VspI",
                "XmaCI",
                "XmaI",
                "XmaIII"
            ],
            "TP": 22,
            "FP": 2,
            "FN": 0
        }
    },
    {
        "test": "limited-list-referents-from-selection-criteria",
        "responder": "gpt-4o",
        "concept": "DNA restriction enzyme",
        "domain": "biology",
        "response": [
            "EcoRI",
            "BamHI",
            "HindIII",
            "PstI",
            "NotI",
            "XhoI",
            "SalI",
            "NcoI",
            "SmaI",
            "SacI",
            "BglII",
            "KpnI",
            "ApaI",
            "ClaI",
            "DraI",
            "EagI",
            "FseI",
            "MluI",
            "NdeI",
            "NheI",
            "PvuII",
            "SpeI",
            "StuI",
            "XbaI"
        ],
        "scorer": "gpt-4o",
        "judgement": {
            "matches": [
                "EcoRI",
                "BamHI",
                "HindIII",
                "PstI",
                "NotI",
                "XhoI",
                "SalI",
                "NcoI",
                "SmaI",
                "SacI",
                "BglII",
                "KpnI",
                "ApaI",
                "ClaI",
                "DraI",
                "EagI",
                "FseI",
                "MluI",
                "NdeI",
                "NheI",
                "PvuII",
                "SpeI",
                "StuI",
                "XbaI"
            ],
            "mismatches": [],
            "true_referents": [
                "",
                "ApaI",
                "AplI",
                "AspNI",
                "BamHI",
                "BamNII",
                "BglI",
                "BglII",
                "BliAI",
                "CcoI",
                "ClaI",
                "CpoI",
                "DpnI",
                "DraI",
                "DraII",
                "DraIII",
                "EaeAI",
                "EagI",
                "EagMI",
                "EcoICRI",
                "EcoRI",
                "EcoRII",
                "EheI",
                "ErhI",
                "FbaI",
                "FseI",
                "FssI",
                "HindII",
                "HindIII",
                "KpnI",
                "LcaI",
                "MfeI",
                "MluB2I",
                "MluI",
                "MluNI",
                "NaeI",
                "NcoI",
                "NdeI",
                "NdeII",
                "NheI",
                "NotI",
                "PaeI",
                "PhaI",
                "PlaI",
                "PstI",
                "PvuI",
                "PvuII",
                "SacI",
                "SacII",
                "SacNI",
                "SalI",
                "SalPI",
                "SatI",
                "ScaI",
                "SfeI",
                "SmaI",
                "SolI",
                "SpeI",
                "SstI",
                "SteI",
                "StuI",
                "SuiI",
                "SwaI",
                "XbaI",
                "XhoI",
                "XhoII",
                "XpaI",
                "ZhoI"
            ],
            "TP": 24,
            "FP": 0,
            "FN": 0
        }
    },
    {
        "test": "limited-list-referents-from-selection-criteria",
        "responder": "gpt-4o-mini",
        "concept": "DNA restriction enzyme",
        "domain": "biology",
        "response": [
            "EcoRI (ECO)",
            "BamHI (BAM)",
            "HindIII (HIND)",
            "NotI (NOT)",
            "SmaI (SMA)",
            "XhoI (XHO)",
            "PstI (PST)",
            "KpnI (KPN)",
            "AatII (AAT)",
            "SacI (SAC)",
            "NheI (NHE)",
            "ApaI (APA)",
            "XbaI (XBA)",
            "HpaI (HPA)",
            "MluI (MLU)",
            "BglII (BGL)",
            "AgeI (AGE)",
            "SfiI (SFI)",
            "FspI (FSP)",
            "NcoI (NCO)",
            "HaeIII (HAE)",
            "TaqI (TAQ)",
            "DraI (DRA)",
            "MspI (MSP)"
        ],
        "scorer": "gpt-4o",
        "judgement": {
            "matches": [
                "EcoRI",
                "BamHI",
                "HindIII",
                "NotI",
                "SmaI",
                "XhoI",
                "PstI",
                "KpnI",
                "AatII",
                "SacI",
                "NheI",
                "ApaI",
                "XbaI",
                "HpaI",
                "MluI",
                "BglII",
                "AgeI",
                "SfiI",
                "FspI",
                "NcoI",
                "HaeIII",
                "TaqI",
                "DraI",
                "MspI"
            ],
            "mismatches": [],
            "true_referents": [
                "",
                "AatI",
                "AatII",
                "AgeI",
                "AhaIII",
                "AitI",
                "ApaI",
                "AspNI",
                "BamHI",
                "BamNII",
                "BglI",
                "BglII",
                "BliAI",
                "BsaI",
                "CaiI",
                "CcoI",
                "CpoI",
                "DpnI",
                "DraI",
                "DraII",
                "DraIII",
                "EarI",
                "EcoICRI",
                "EcoRI",
                "EcoRII",
                "EheI",
                "ErhI",
                "FbaI",
                "FspI",
                "FspII",
                "FspMSI",
                "GstI",
                "HaeI",
                "HaeII",
                "HaeIII",
                "HindII",
                "HindIII",
                "HpaI",
                "HpaII",
                "HphI",
                "KpnI",
                "Mlu23I",
                "MluI",
                "MluNI",
                "MspI",
                "NaeI",
                "NcoI",
                "NheI",
                "NopI",
                "NotI",
                "PstI",
                "SacI",
                "SacII",
                "SacNI",
                "ScaI",
                "SfiI",
                "SmaI",
                "SmiI",
                "SsiI",
                "SspI",
                "TaqI",
                "TaqII",
                "TaqXI",
                "VspI",
                "XbaI",
                "XhoI",
                "XhoII",
                "XpaI",
                "ZhoI"
            ],
            "TP": 24,
            "FP": 0,
            "FN": 0
        }
    },
    {
        "test": "limited-list-referents-from-selection-criteria",
        "responder": "gpt-4-32k",
        "concept": "DNA restriction enzyme",
        "domain": "biology",
        "response": [
            "Type I Restriction Enzyme (EcoKI)",
            "Type I Restriction Enzyme (EcoAI)",
            "Type I Restriction Enzyme (EcoBI)",
            "Type I Restriction Enzyme (EcoEI)",
            "Type I Restriction Enzyme (EcoJI)",
            "Type I Restriction Enzyme (EcoLI)",
            "Type I Restriction Enzyme (EcoMI)",
            "Type I Restriction Enzyme (EcoNI)",
            "Type I Restriction Enzyme (EcoPI)",
            "Type I Restriction Enzyme (EcoRI)",
            "Type I Restriction Enzyme (EcoSI)",
            "Type I Restriction Enzyme (EcoTI)",
            "Type I Restriction Enzyme (EcoUI)",
            "Type I Restriction Enzyme (EcoVI)",
            "Type I Restriction Enzyme (EcoWI)",
            "Type I Restriction Enzyme (EcoXI)",
            "Type I Restriction Enzyme (EcoYI)",
            "Type I Restriction Enzyme (EcoZI)",
            "Type I Restriction Enzyme (EcoAI)",
            "Type I Restriction Enzyme (EcoBI)",
            "Type I Restriction Enzyme (EcoCI)",
            "Type I Restriction Enzyme (EcoDI)",
            "Type I Restriction Enzyme (EcoEI)",
            "Type I Restriction Enzyme (EcoFI)"
        ],
        "scorer": "gpt-4o",
        "judgement": {
            "matches": [
                "EcoNI",
                "EcoRI"
            ],
            "mismatches": [
                "Type I Restriction Enzyme (EcoKI)",
                "Type I Restriction Enzyme (EcoAI)",
                "Type I Restriction Enzyme (EcoBI)",
                "Type I Restriction Enzyme (EcoEI)",
                "Type I Restriction Enzyme (EcoJI)",
                "Type I Restriction Enzyme (EcoLI)",
                "Type I Restriction Enzyme (EcoMI)",
                "Type I Restriction Enzyme (EcoPI)",
                "Type I Restriction Enzyme (EcoSI)",
                "Type I Restriction Enzyme (EcoTI)",
                "Type I Restriction Enzyme (EcoUI)",
                "Type I Restriction Enzyme (EcoVI)",
                "Type I Restriction Enzyme (EcoWI)",
                "Type I Restriction Enzyme (EcoXI)",
                "Type I Restriction Enzyme (EcoYI)",
                "Type I Restriction Enzyme (EcoZI)",
                "Type I Restriction Enzyme (EcoCI)",
                "Type I Restriction Enzyme (EcoDI)",
                "Type I Restriction Enzyme (EcoFI)"
            ],
            "true_referents": [
                "AeuI",
                "Ecl2zI",
                "EclI",
                "Eco13kI",
                "Eco21kI",
                "Eco91I",
                "EcoA4I",
                "EcoHK31I",
                "EcoNI",
                "EcoP15I",
                "EcoRI",
                "EcoRII",
                "EcoRV",
                "EcoT14I",
                "EcoT22I",
                "EcoT38I",
                "EcoVIII",
                "PceI",
                "StyI",
                "Tru1I"
            ],
            "TP": 2,
            "FP": 19,
            "FN": 0
        }
    },
    {
        "test": "limited-list-referents-from-selection-criteria",
        "responder": "gpt-35-turbo-16k",
        "concept": "DNA restriction enzyme",
        "domain": "biology",
        "response": [
            "Restriction enzyme (RE1)",
            "Restriction enzyme (RE2)",
            "Restriction enzyme (RE3)",
            "Restriction enzyme (RE4)",
            "Restriction enzyme (RE5)",
            "Restriction enzyme (RE6)",
            "Restriction enzyme (RE7)",
            "Restriction enzyme (RE8)",
            "Restriction enzyme (RE9)",
            "Restriction enzyme (RE10)",
            "Restriction enzyme (RE11)",
            "Restriction enzyme (RE12)",
            "Restriction enzyme (RE13)",
            "Restriction enzyme (RE14)",
            "Restriction enzyme (RE15)",
            "Restriction enzyme (RE16)",
            "Restriction enzyme (RE17)",
            "Restriction enzyme (RE18)",
            "Restriction enzyme (RE19)",
            "Restriction enzyme (RE20)",
            "Restriction enzyme (RE21)",
            "Restriction enzyme (RE22)",
            "Restriction enzyme (RE23)",
            "Restriction enzyme (RE24)"
        ],
        "scorer": "gpt-4o",
        "judgement": {
            "matches": [],
            "mismatches": [
                "Restriction enzyme (RE1)",
                "Restriction enzyme (RE2)",
                "Restriction enzyme (RE3)",
                "Restriction enzyme (RE4)",
                "Restriction enzyme (RE5)",
                "Restriction enzyme (RE6)",
                "Restriction enzyme (RE7)",
                "Restriction enzyme (RE8)",
                "Restriction enzyme (RE9)",
                "Restriction enzyme (RE10)",
                "Restriction enzyme (RE11)",
                "Restriction enzyme (RE12)",
                "Restriction enzyme (RE13)",
                "Restriction enzyme (RE14)",
                "Restriction enzyme (RE15)",
                "Restriction enzyme (RE16)",
                "Restriction enzyme (RE17)",
                "Restriction enzyme (RE18)",
                "Restriction enzyme (RE19)",
                "Restriction enzyme (RE20)",
                "Restriction enzyme (RE21)",
                "Restriction enzyme (RE22)",
                "Restriction enzyme (RE23)",
                "Restriction enzyme (RE24)"
            ],
            "true_referents": [
                "",
                "AceII",
                "Aor13HI",
                "Bbr7I",
                "Bme12I",
                "Bme18I",
                "Bse118I",
                "Bse15I",
                "Bse16I",
                "Bse17I",
                "Bse1I",
                "Bse21I",
                "Bse24I",
                "Bse634I",
                "Bse8I",
                "BspLU11I",
                "Bsu15I",
                "Bsu23I",
                "Cfr10I",
                "CfrJ4I",
                "Eco13kI",
                "EcoA4I",
                "EcoP15I",
                "EcoT14I",
                "EcoT22I",
                "ErhB9I",
                "ErhB9II",
                "HgiS22I",
                "Ksp22I",
                "MaeIII",
                "Msp17I",
                "Pae14kI",
                "PaeR7I",
                "Pde12I",
                "Pde133I",
                "Ple19I",
                "Rme21I",
                "Rsr2I",
                "SenPT16I",
                "Sse9I"
            ],
            "TP": 0,
            "FP": 24,
            "FN": 0
        }
    },
    {
        "test": "limited-list-referents-from-selection-criteria",
        "responder": "o1-mini",
        "concept": "DNA restriction enzyme",
        "domain": "biology",
        "response": [
            "EcoRI (EcoRI)",
            "BamHI (BamHI)",
            "HindIII (HindIII)",
            "NotI (NotI)",
            "PstI (PstI)",
            "SmaI (SmaI)",
            "SacI (SacI)",
            "XhoI (XhoI)",
            "KpnI (KpnI)",
            "NcoI (NcoI)",
            "SpeI (SpeI)",
            "ApaI (ApaI)",
            "AlwI (AlwI)",
            "BglII (BglII)",
            "EagI (EagI)",
            "HaeIII (HaeIII)",
            "MluI (MluI)",
            "SphI (SphI)",
            "XbaI (XbaI)",
            "PvuII (PvuII)",
            "AvrII (AvrII)",
            "AgeI (AgeI)",
            "BsrGI (BsrGI)",
            "DraI (DraI)"
        ],
        "scorer": "gpt-4o",
        "judgement": {
            "matches": [
                "EcoRI",
                "BamHI",
                "HindIII",
                "NotI",
                "PstI",
                "SmaI",
                "SacI",
                "XhoI",
                "KpnI",
                "NcoI",
                "SpeI",
                "ApaI",
                "AlwI",
                "BglII",
                "EagI",
                "HaeIII",
                "MluI",
                "SphI",
                "XbaI",
                "PvuII",
                "AvrII",
                "AgeI",
                "BsrGI",
                "DraI"
            ],
            "mismatches": [],
            "true_referents": [
                "AbrI",
                "AceI",
                "AcrII",
                "AgeI",
                "AhaIII",
                "Alw26I",
                "AlwI",
                "AlwNI",
                "ApaI",
                "AsiAI",
                "AspNI",
                "AvrII",
                "BamHI",
                "BamNII",
                "BglI",
                "BglII",
                "BliAI",
                "BseGI",
                "BsrGI",
                "BsrSI",
                "CcoI",
                "CpoI",
                "DpnI",
                "DraI",
                "DraII",
                "DraIII",
                "EaeAI",
                "EagI",
                "EagMI",
                "EcoICRI",
                "EcoRI",
                "EcoRII",
                "ErhI",
                "FbaI",
                "GstI",
                "HaeII",
                "HaeIII",
                "HindII",
                "HindIII",
                "KpnI",
                "Mlu23I",
                "MluI",
                "MluNI",
                "NcoI",
                "NotI",
                "PaeI",
                "PhaI",
                "PovII",
                "PstI",
                "PvuI",
                "PvuII",
                "SacI",
                "SacII",
                "SacNI",
                "ScaI",
                "SchI",
                "SmaI",
                "SpeI",
                "SphI",
                "SplI",
                "SwaI",
                "XbaI",
                "XhoI",
                "XhoII",
                "XpaI",
                "ZhoI"
            ],
            "TP": 24,
            "FP": 0,
            "FN": 0
        }
    },
    {
        "test": "limited-list-referents-from-selection-criteria",
        "responder": "anthropic.claude-3-5-sonnet-v1:0",
        "concept": "DNA restriction enzyme",
        "domain": "biology",
        "response": [
            "Type I restriction enzyme",
            "Type II restriction enzyme",
            "Type III restriction enzyme",
            "Type IV restriction enzyme",
            "EcoRI",
            "BamHI",
            "HindIII",
            "NotI",
            "PstI",
            "SmaI",
            "XhoI",
            "KpnI",
            "SalI",
            "EcoRV",
            "HaeIII",
            "MspI",
            "TaqI",
            "DpnI",
            "MboI",
            "Sau3AI",
            "AluI",
            "BglII",
            "NdeI",
            "PvuII"
        ],
        "scorer": "gpt-4o",
        "judgement": {
            "matches": [
                "EcoRI",
                "BamHI",
                "HindIII",
                "NotI",
                "PstI",
                "SmaI",
                "XhoI",
                "KpnI",
                "SalI",
                "EcoRV",
                "HaeIII",
                "MspI",
                "TaqI",
                "DpnI",
                "MboI",
                "Sau3AI",
                "AluI",
                "BglII",
                "NdeI",
                "PvuII"
            ],
            "mismatches": [
                "Type I restriction enzyme",
                "Type II restriction enzyme",
                "Type III restriction enzyme",
                "Type IV restriction enzyme"
            ],
            "true_referents": [
                "",
                "AauI",
                "AceII",
                "AloI",
                "AluI",
                "AplI",
                "AsiI",
                "AspNI",
                "BamHI",
                "BamNII",
                "BcoI",
                "BglI",
                "BglII",
                "BliAI",
                "Bse1I",
                "Bse21I",
                "CfrA4I",
                "CfrJ4I",
                "DpnI",
                "DpnII",
                "EcoICRI",
                "EcoRI",
                "EcoRII",
                "EcoRV",
                "ErhI",
                "HaeI",
                "HaeII",
                "HaeIII",
                "HindII",
                "HindIII",
                "Hsp92II",
                "KpnI",
                "MaeIII",
                "MboI",
                "MboII",
                "MfeI",
                "MspB4I",
                "MspI",
                "NdeI",
                "NdeII",
                "NotI",
                "PstI",
                "PvuI",
                "PvuII",
                "SalI",
                "SalPI",
                "SatI",
                "Sau3AI",
                "Sau96I",
                "SauI",
                "ScaI",
                "SmaI",
                "SmiI",
                "SolI",
                "SspI",
                "SstI",
                "SwaI",
                "TaqI",
                "TaqII",
                "TaqXI",
                "Tru1I",
                "VspI",
                "XhoI",
                "XhoII",
                "XmaIII",
                "ZhoI"
            ],
            "TP": 20,
            "FP": 4,
            "FN": 0
        }
    },
    {
        "test": "limited-list-referents-from-selection-criteria",
        "responder": "anthropic.claude-3-opus-v1:0",
        "concept": "DNA restriction enzyme",
        "domain": "biology",
        "response": [
            "EcoKI (type I restriction enzyme)",
            "EcoRI (type II restriction enzyme)",
            "BamHI (type II restriction enzyme)",
            "HindIII (type II restriction enzyme)",
            "NotI (type II restriction enzyme)",
            "PstI (type II restriction enzyme)",
            "SmaI (type II restriction enzyme)",
            "XhoI (type II restriction enzyme)",
            "EcoRV (type II restriction enzyme)",
            "SacI (type II restriction enzyme)",
            "KpnI (type II restriction enzyme)",
            "SalI (type II restriction enzyme)",
            "XbaI (type II restriction enzyme)",
            "SphI (type II restriction enzyme)",
            "NheI (type II restriction enzyme)",
            "BglII (type II restriction enzyme)",
            "ApaI (type II restriction enzyme)",
            "SpeI (type II restriction enzyme)",
            "NcoI (type II restriction enzyme)",
            "NdeI (type II restriction enzyme)",
            "AgeI (type II restriction enzyme)",
            "MluI (type II restriction enzyme)",
            "SfiI (type II restriction enzyme)",
            "FseI (type II restriction enzyme)"
        ],
        "scorer": "gpt-4o",
        "judgement": {
            "matches": [
                "EcoRI",
                "BamHI",
                "HindIII",
                "PstI",
                "SmaI",
                "XhoI",
                "EcoRV",
                "SacI",
                "KpnI",
                "SalI",
                "XbaI",
                "SphI",
                "NheI",
                "BglII",
                "ApaI",
                "SpeI",
                "NcoI",
                "NdeI",
                "AgeI",
                "MluI",
                "SfiI",
                "FseI"
            ],
            "mismatches": [
                "EcoKI",
                "NotI"
            ],
            "true_referents": [
                "AceI",
                "AgeI",
                "ApaI",
                "AsiI",
                "BamHI",
                "BamNII",
                "Bco5I",
                "BglI",
                "BglII",
                "BliAI",
                "CcoI",
                "CpoI",
                "DsaIII",
                "EarI",
                "Eco13kI",
                "Eco21kI",
                "EcoHK31I",
                "EcoICRI",
                "EcoR124II",
                "EcoRI",
                "EcoRII",
                "EcoRV",
                "FbaI",
                "FseI",
                "FssI",
                "GstI",
                "HgiHIII",
                "HindIII",
                "Kpn2I",
                "Kpn2kI",
                "KpnI",
                "MbiI",
                "MfeI",
                "MluB2I",
                "MluI",
                "MluNI",
                "NaeI",
                "NcoI",
                "NdeI",
                "NdeII",
                "NheI",
                "NopI",
                "NsiI",
                "PceI",
                "PstI",
                "PtaI",
                "SacI",
                "SacII",
                "SacNI",
                "SalI",
                "SchI",
                "SecI",
                "SfeI",
                "SfiI",
                "SmaI",
                "SmiI",
                "SniI",
                "SpeI",
                "SphI",
                "SpmI",
                "SsiI",
                "SteI",
                "XbaI",
                "XhoI",
                "XhoII",
                "XpaI"
            ],
            "TP": 22,
            "FP": 2,
            "FN": 0
        }
    },
    {
        "test": "limited-list-referents-from-selection-criteria",
        "responder": "anthropic.claude-3-sonnet-v1:0",
        "concept": "DNA restriction enzyme",
        "domain": "biology",
        "response": [
            "Restriction endonuclease (RE)",
            "EcoRI",
            "BamHI",
            "HindIII",
            "SalI",
            "XbaI",
            "PstI",
            "EcoRV",
            "SmaI",
            "KpnI",
            "SacI",
            "XhoI",
            "NdeI",
            "BglII",
            "HaeIII",
            "AluI",
            "RsaI",
            "TaqI",
            "Sau3AI",
            "MboI",
            "DpnI",
            "Cfr9I",
            "SgrAI",
            "BsmI"
        ],
        "scorer": "gpt-4o",
        "judgement": {
            "matches": [
                "EcoRI",
                "BamHI",
                "HindIII",
                "SalI",
                "XbaI",
                "PstI",
                "EcoRV",
                "SmaI",
                "KpnI",
                "SacI",
                "XhoI",
                "NdeI",
                "BglII",
                "HaeIII",
                "AluI",
                "RsaI",
                "TaqI",
                "Sau3AI",
                "MboI",
                "DpnI",
                "Cfr9I",
                "SgrAI",
                "BsmI"
            ],
            "mismatches": [
                "Restriction endonuclease (RE)"
            ],
            "true_referents": [
                "",
                "AauI",
                "AloI",
                "AluI",
                "AspNI",
                "BamHI",
                "BamNII",
                "BcoI",
                "BglI",
                "BglII",
                "BliAI",
                "BscI",
                "Bse21I",
                "Bse634I",
                "BsmI",
                "BsrAI",
                "BssSI",
                "Cfr13I",
                "Cfr6I",
                "Cfr9I",
                "DpnI",
                "DpnII",
                "DsaI",
                "EcoICRI",
                "EcoRI",
                "EcoRII",
                "EcoRV",
                "ErhI",
                "FbaI",
                "HaeI",
                "HaeII",
                "HaeIII",
                "HindII",
                "HindIII",
                "KpnI",
                "MboI",
                "MboII",
                "MfeI",
                "NdeI",
                "NdeII",
                "PstI",
                "RsaI",
                "SacI",
                "SacII",
                "SacNI",
                "SalI",
                "SalPI",
                "SatI",
                "Sau3AI",
                "Sau96I",
                "SauI",
                "ScaI",
                "SgrAI",
                "SmaI",
                "SolI",
                "SstI",
                "SwaI",
                "TaqI",
                "TaqII",
                "TaqXI",
                "XbaI",
                "XhoI",
                "XhoII",
                "XpaI",
                "ZhoI",
                "ZraI"
            ],
            "TP": 23,
            "FP": 1,
            "FN": 0
        }
    },
    {
        "test": "limited-list-referents-from-selection-criteria",
        "responder": "anthropic.claude-3-haiku-v1:0",
        "concept": "DNA restriction enzyme",
        "domain": "biology",
        "response": [
            "Restriction Endonuclease (RE)",
            "EcoRI (EcoRI)",
            "BamHI (BamHI)",
            "HindIII (HindIII)",
            "PstI (PstI)",
            "SalI (SalI)",
            "XhoI (XhoI)",
            "NotI (NotI)",
            "SmaI (SmaI)",
            "KpnI (KpnI)",
            "ApaI (ApaI)",
            "SacI (SacI)",
            "DpnI (DpnI)",
            "MboI (MboI)",
            "Sau3AI (Sau3AI)",
            "BglII (BglII)",
            "AluI (AluI)",
            "HaeIII (HaeIII)",
            "TaqI (TaqI)",
            "MspI (MspI)",
            "HpaII (HpaII)",
            "BstNI (BstNI)",
            "NcoI (NcoI)",
            "NdeI (NdeI)"
        ],
        "scorer": "gpt-4o",
        "judgement": {
            "matches": [
                "EcoRI",
                "BamHI",
                "HindIII",
                "PstI",
                "SalI",
                "XhoI",
                "NotI",
                "SmaI",
                "KpnI",
                "ApaI",
                "SacI",
                "DpnI",
                "MboI",
                "Sau3AI",
                "BglII",
                "AluI",
                "HaeIII",
                "TaqI",
                "MspI",
                "HpaII",
                "NcoI",
                "NdeI"
            ],
            "mismatches": [
                "Restriction Endonuclease (RE)",
                "BstNI"
            ],
            "true_referents": [
                "",
                "AauI",
                "AhaIII",
                "AluI",
                "ApaI",
                "AspNI",
                "AsuI",
                "BamHI",
                "BamNII",
                "BcoI",
                "BglI",
                "BglII",
                "BliAI",
                "Bse21I",
                "Bse634I",
                "BspNI",
                "BspTNI",
                "BssNI",
                "CcoI",
                "CpoI",
                "DpnI",
                "DpnII",
                "EcoICRI",
                "EcoRI",
                "EcoRII",
                "ErhI",
                "GstI",
                "HaeII",
                "HaeIII",
                "HindII",
                "HindIII",
                "HpaI",
                "HpaII",
                "KpnI",
                "MboI",
                "MboII",
                "MfeI",
                "MspI",
                "NcoI",
                "NdeI",
                "NdeII",
                "NotI",
                "PfaAII",
                "PhaI",
                "PovII",
                "PstI",
                "SacI",
                "SacII",
                "SacNI",
                "SalI",
                "SalPI",
                "Sau3AI",
                "Sau96I",
                "SauI",
                "ScaI",
                "SelI",
                "SmaI",
                "SspI",
                "SwaI",
                "TaqI",
                "TaqII",
                "TaqXI",
                "VspI",
                "XhoI",
                "XhoII",
                "ZhoI"
            ],
            "TP": 22,
            "FP": 2,
            "FN": 0
        }
    },
    {
        "test": "limited-list-referents-from-selection-criteria",
        "responder": "meta.llama3-8b-instruct-v1:0",
        "concept": "DNA restriction enzyme",
        "domain": "biology",
        "response": [
            "EcoRI (EC 3.1.21.4) - E. coli RNA polymerase I restriction endonuclease",
            "BamHI (EC 3.1.21.4) - Bacillus amyloliquefaciens restriction endonuclease",
            "HindIII (EC 3.1.21.4) - Haemophilus influenzae restriction endonuclease",
            "PstI (EC 3.1.21.4) - Providencia stuartii restriction endonuclease",
            "SmaI (EC 3.1.21.4) - Serratia marcescens restriction endonuclease",
            "XbaI (EC 3.1.21.4) - Xanthomonas badensis restriction endonuclease",
            "BglII (EC 3.1.21.4) - Bacillus globigii restriction endonuclease",
            "EcoRV (EC 3.1.21.4) - E. coli RNA polymerase II restriction endonuclease",
            "PvuII (EC 3.1.21.4) - Providencia vermicola restriction endonuclease",
            "KpnI (EC 3.1.21.4) - Klebsiella pneumoniae restriction endonuclease",
            "NcoI (EC 3.1.21.4) - Neisseria gonorrhoeae restriction endonuclease",
            "SphI (EC 3.1.21.4) - Streptomyces phaeochromogenes restriction endonuclease",
            "XhoI (EC 3.1.21.4) - Xanthomonas oryzae restriction endonuclease",
            "BstXI (EC 3.1.21.4) - Bacillus stearothermophilus restriction endonuclease",
            "HpaII (EC 3.1.21.4) - Haemophilus parainfluenzae restriction endonuclease",
            "MspI (EC 3.1.21.4) - Moraxella sp. restriction endonuclease",
            "NheI (EC 3.1.21.4) - Neisseria meningitidis restriction endonuclease",
            "PacI (EC 3.1.21.4) - Pseudomonas aeruginosa restriction endonuclease",
            "SalI (EC 3.1.21.4) - Streptomyces albus restriction endonuclease",
            "SfiI (EC 3.1.21.4) - Streptomyces filamentosus restriction endonuclease",
            "SpeI (EC 3.1.21.4) - Streptomyces phaeochromogenes restriction endonuclease",
            "XhoII (EC 3.1.21.4) - Xanthomonas oryzae restriction endonuclease"
        ],
        "scorer": "gpt-4o",
        "judgement": {
            "matches": [
                "EcoRI",
                "BamHI",
                "HindIII",
                "PstI",
                "SmaI",
                "XbaI",
                "BglII",
                "EcoRV",
                "PvuII",
                "KpnI",
                "NcoI",
                "SphI",
                "XhoI",
                "HpaII",
                "MspI",
                "NheI",
                "PacI",
                "SalI",
                "SfiI",
                "SpeI",
                "XhoII"
            ],
            "mismatches": [
                "BstXI"
            ],
            "true_referents": [
                "BamHI",
                "BglI",
                "BglII",
                "BliAI",
                "BshI",
                "BsiXI",
                "BspLAI",
                "BspXI",
                "CboI",
                "CpoI",
                "DpnI",
                "EcoICRI",
                "EcoR124II",
                "EcoRI",
                "EcoRII",
                "EcoRV",
                "EcoT22I",
                "ErhB9I",
                "ErhB9II",
                "FbaI",
                "FspII",
                "HgiHIII",
                "HindII",
                "HindIII",
                "HpaI",
                "HpaII",
                "Kpn2I",
                "KpnI",
                "MmeI",
                "MspI",
                "MspR9I",
                "NaeI",
                "NcoI",
                "NheI",
                "NspI",
                "Pac25I",
                "PacI",
                "PfaAII",
                "PleI",
                "PssI",
                "PstI",
                "PvuI",
                "PvuII",
                "RspXI",
                "SalI",
                "SalPI",
                "ScaI",
                "SchI",
                "SfiI",
                "SmaI",
                "SmiI",
                "SpeI",
                "SphI",
                "SpmI",
                "SteI",
                "XbaI",
                "XhoI",
                "XhoII",
                "XpaI"
            ],
            "TP": 21,
            "FP": 1,
            "FN": 0
        }
    },
    {
        "test": "limited-list-referents-from-selection-criteria",
        "responder": "meta.llama3-70b-instruct-v1:0",
        "concept": "DNA restriction enzyme",
        "domain": "biology",
        "response": [
            "EcoRI (EC 3.1.21.4)",
            "EcoRV (EC 3.1.21.4)",
            "HindIII (EC 3.1.21.4)",
            "BamHI (EC 3.1.21.4)",
            "PstI (EC 3.1.21.4)",
            "NotI (EC 3.1.21.4)",
            "SalI (EC 3.1.21.4)",
            "XhoI (EC 3.1.21.4)",
            "HaeIII (EC 3.1.21.4)",
            "MspI (EC 3.1.21.4)",
            "SacI (EC 3.1.21.4)",
            "KpnI (EC 3.1.21.4)",
            "XbaI (EC 3.1.21.4)",
            "AvaI (EC 3.1.21.4)",
            "AvaII (EC 3.1.21.4)",
            "SmaI (EC 3.1.21.4)",
            "NciI (EC 3.1.21.4)",
            "NdeI (EC 3.1.21.4)",
            "BglII (EC 3.1.21.4)",
            "BstXI (EC 3.1.21.4)",
            "BstYI (EC 3.1.21.4)",
            "PaeI (EC 3.1.21.4)",
            "SfiI (EC 3.1.21.4)",
            "SgrAI (EC 3.1.21.4)"
        ],
        "scorer": "gpt-4o",
        "judgement": {
            "matches": [
                "EcoRI",
                "EcoRV",
                "HindIII",
                "BamHI",
                "PstI",
                "NotI",
                "SalI",
                "XhoI",
                "HaeIII",
                "MspI",
                "SacI",
                "KpnI",
                "XbaI",
                "AvaI",
                "AvaII",
                "SmaI",
                "NciI",
                "NdeI",
                "BglII",
                "PaeI",
                "SfiI",
                "SgrAI"
            ],
            "mismatches": [
                "BstXI",
                "BstYI"
            ],
            "true_referents": [
                "AhaIII",
                "ApaI",
                "AsiI",
                "AspI",
                "AvaI",
                "AvaII",
                "AvrBII",
                "BamHI",
                "BamNII",
                "BglI",
                "BglII",
                "BliAI",
                "BseBI",
                "BseYI",
                "BshI",
                "BsiXI",
                "BsiYI",
                "BspXI",
                "BsrAI",
                "DpnI",
                "DsaI",
                "EcoICRI",
                "EcoR124II",
                "EcoRI",
                "EcoRII",
                "EcoRV",
                "FbaI",
                "GdiII",
                "GstI",
                "HaeII",
                "HaeIII",
                "HindII",
                "HindIII",
                "Kpn2I",
                "KpnI",
                "MspI",
                "NciI",
                "NdeI",
                "NdeII",
                "NopI",
                "NotI",
                "NsiI",
                "PaeHII",
                "PaeI",
                "PovII",
                "PstI",
                "RspXI",
                "SacI",
                "SacII",
                "SacNI",
                "SalI",
                "SalPI",
                "SdiI",
                "SelI",
                "SfiI",
                "SgrAI",
                "SmaI",
                "SniI",
                "SsiI",
                "SspI",
                "XbaI",
                "XhoI",
                "XhoII",
                "XpaI",
                "ZhoI",
                "ZraI"
            ],
            "TP": 22,
            "FP": 2,
            "FN": 0
        }
    },
    {
        "test": "limited-list-referents-from-selection-criteria",
        "responder": "amazon.titan-text-express-v1",
        "concept": "DNA restriction enzyme",
        "domain": "biology",
        "response": [
            {
                "Example": "EcoRI",
                "Canonical name": "EcoRI endonuclease"
            },
            {
                "Example": "HindIII",
                "Canonical name": "HindIII endonuclease"
            }
        ],
        "scorer": "gpt-4o",
        "judgement": {
            "matches": [
                "HindIII"
            ],
            "mismatches": [
                "EcoRI"
            ],
            "true_referents": [
                "",
                "AscI",
                "EcoT22I",
                "HindIII"
            ],
            "TP": 1,
            "FP": 1,
            "FN": 0
        }
    }
]