[
    {
        "test": "limited-list-referents",
        "responder": "qwen-v2.5-14b-instruct",
        "concept": "diterpene",
        "domain": "chemistry",
        "response": [
            "Abietic acid (AA)",
            "Andrographolide",
            "Artemisinin",
            "Bilobalide",
            "Carnosic acid",
            "Daucosterol",
            "Dehydroabietic acid",
            "Diterpinoid",
            "Ergovaline",
            "Ginkgolide A",
            "Ginkgolide B",
            "Ginkgolide C",
            "Ginkgolide J",
            "Himachalene",
            "Isopimaric acid",
            "Jasmonic acid",
            "Kaur-16-en-19-oic acid",
            "Lactucin",
            "Lup-20(29)-en-3\u03b2-ol",
            "Manoylin",
            "Nepodin",
            "Paclitaxel (Taxol)",
            "Pimaric acid",
            "Pulchellin"
        ],
        "scorer": "gpt-4o",
        "judgement": {
            "matches": [],
            "mismatches": [
                "Abietic acid (AA)",
                "Andrographolide",
                "Artemisinin",
                "Bilobalide",
                "Carnosic acid",
                "Daucosterol",
                "Dehydroabietic acid",
                "Diterpinoid",
                "Ergovaline",
                "Ginkgolide A",
                "Ginkgolide B",
                "Ginkgolide C",
                "Ginkgolide J",
                "Himachalene",
                "Isopimaric acid",
                "Jasmonic acid",
                "Kaur-16-en-19-oic acid",
                "Lactucin",
                "Lup-20(29)-en-3\u03b2-ol",
                "Manoylin",
                "Nepodin",
                "Paclitaxel (Taxol)",
                "Pimaric acid",
                "Pulchellin"
            ],
            "true_referents": [
                "(-)-spiroviolene",
                "(R)-axinyssene",
                "(R)-nephthenol",
                "(S)-axinyssene",
                "(Z)-biformene",
                "11-O-acetylcyathin A3",
                "15,16-epoxydolabrene",
                "16alpha-hydroxy-ent-kaurene",
                "3beta-hydroxy-15,16-epoxydolabrene",
                "4-hydroxycasbene",
                "5,8-dihydroxy-4-oxocasbene",
                "8-hydroxycasbene",
                "9-deoxy-hymatoxin A",
                "Rhodojaponin I",
                "Rhodojaponin III",
                "abieta-7,13-diene",
                "abieta-8(14),12-diene",
                "abietatriene",
                "beta-pinacene",
                "cephalot-3(20)-ene",
                "cneorubyn Y",
                "delta-araneosene",
                "dihydroserrulatene",
                "dolabella-3,7,12-triene",
                "ent-(12E)-labda-8(17),12,14-triene",
                "ent-isokaurene",
                "ent-kaurane",
                "ent-trachyloban-3beta-ol",
                "erinacine Q",
                "gibberellane",
                "halimane",
                "isopimara-7,15-diene",
                "isopimara-8(14),15-diene",
                "isopimarane",
                "neoabietadiene",
                "neophytadiene",
                "phyllocladan-16alpha-ol",
                "pimara-8(14),15-diene",
                "pimaradiene",
                "pimarane",
                "rhizathalene A",
                "sclarene",
                "spata-13,17-diene",
                "spiroalbatene",
                "spiroluchuene A",
                "spiroluchuene B",
                "taxane"
            ],
            "TP": 0,
            "FP": 24,
            "FN": 0
        }
    },
    {
        "test": "limited-list-referents",
        "responder": "phi-v4",
        "concept": "diterpene",
        "domain": "chemistry",
        "response": [
            "Abietic acid (CAS: 80-56-8)",
            "Cembrene A",
            "Cycloartenol",
            "Ginkgolide A",
            "Ginkgolide B",
            "Ginkgolide C",
            "Ginkgolide J",
            "Ginkgolide M",
            "Ginkgolide N",
            "Ginkgolide P",
            "Ginkgolide Q",
            "Ginkgolide R",
            "Ginkgolide S",
            "Ginkgolide Z",
            "Labdane",
            "Limonene",
            "Marrubenol",
            "Nootkatone",
            "Phytol (CAS: 79-76-3)",
            "Reticuline",
            "Sclareol",
            "Taxadiene",
            "Taxol (Paclitaxel, CAS: 33069-62-4)",
            "Tetrahydrocannabinol (THC, CAS: 1972-08-3)"
        ],
        "scorer": "gpt-4o",
        "judgement": {
            "matches": [
                "labdane"
            ],
            "mismatches": [
                "Abietic acid (CAS: 80-56-8)",
                "Cembrene A",
                "Cycloartenol",
                "Ginkgolide A",
                "Ginkgolide B",
                "Ginkgolide C",
                "Ginkgolide J",
                "Ginkgolide M",
                "Ginkgolide N",
                "Ginkgolide P",
                "Ginkgolide Q",
                "Ginkgolide R",
                "Ginkgolide S",
                "Ginkgolide Z",
                "Limonene",
                "Marrubenol",
                "Nootkatone",
                "Phytol (CAS: 79-76-3)",
                "Reticuline",
                "Sclareol",
                "Taxadiene",
                "Taxol (Paclitaxel, CAS: 33069-62-4)",
                "Tetrahydrocannabinol (THC, CAS: 1972-08-3)"
            ],
            "true_referents": [
                "(-)-spiroviolene",
                "(12E)-labda-8(17),12,14-triene",
                "(R)-axinyssene",
                "(R)-cembrene A",
                "(R)-nephthenol",
                "(S)-axinyssene",
                "(Z)-biformene",
                "4-hydroxycasbene",
                "5,8-dihydroxy-4-oxocasbene",
                "8-hydroxycasbene",
                "Rhodojaponin I",
                "Rhodojaponin III",
                "abieta-7,13-diene",
                "abieta-8(14),12-diene",
                "abietane",
                "abietatriene",
                "alpha-camphorene",
                "beta-pinacene",
                "cembrene C",
                "cycloaraneosene",
                "ent-atiserene",
                "ent-isokaurene",
                "ent-kaurane",
                "ent-kaurene",
                "erinacine Q",
                "gamma-camphorene",
                "isocatenula-2(6),14-diene",
                "isocatenula-2,14-diene",
                "kanakugiol",
                "labda-7,13(16),14-triene",
                "labdane",
                "phyllocladan-16alpha-ol",
                "phytane",
                "rhizathalene A",
                "sclarene",
                "serratol",
                "sobralene",
                "spiroluchuene A",
                "spiroluchuene B",
                "taxa-4,11-diene",
                "taxa-420,1112-diene",
                "taxane",
                "terpentetriene",
                "variediene"
            ],
            "TP": 1,
            "FP": 23,
            "FN": 0
        }
    },
    {
        "test": "limited-list-referents",
        "responder": "mistral-small-instruct-24B",
        "concept": "diterpene",
        "domain": "chemistry",
        "response": [
            "Abietadiene (CAS: 473-28-9)",
            "Ambrosin (CAS: 546-71-2)",
            "Andrographolide (CAS: 5508-58-7)",
            "Caulerpenyne (CAS: 54384-93-9)",
            "Cembrene (CAS: 25283-05-6)",
            "Cembrenoid",
            "Clerodane (CAS: 22558-56-7)",
            "Cryptotanshinone (CAS: 33855-05-5)",
            "Cubebol (CAS: 474-51-1)",
            "Daphnane (CAS: 546-71-2)",
            "Forskolin (CAS: 66558-72-9)",
            "Ginkgolide A (CAS: 113167-80-9)",
            "Ginkgolide B (CAS: 113167-81-0)",
            "Ginkgolide C (CAS: 113167-82-1)",
            "Ginkgolide J (CAS: 113167-83-2)",
            "Ginkgolide M (CAS: 113167-84-3)",
            "Isosteviol (CAS: 16931-31-0)",
            "Kaurene (CAS: 35674-23-8)",
            "Lycopodine (CAS: 523-58-6)",
            "Paclitaxel (CAS: 33069-62-4)",
            "Phorbol (CAS: 17088-81-6)",
            "Phorbol-12-myristate-13-acetate (CAS: 16561-29-8)",
            "Podolactone (CAS: 22558-56-7)",
            "Sclareol (CAS: 533-86-4)",
            "Steviol (CAS: 34294-10-9)"
        ],
        "scorer": "gpt-4o",
        "judgement": {
            "matches": [
                "Abietadiene (CAS: 473-28-9)",
                "Kaurene (CAS: 35674-23-8)"
            ],
            "mismatches": [
                "Ambrosin (CAS: 546-71-2)",
                "Andrographolide (CAS: 5508-58-7)",
                "Caulerpenyne (CAS: 54384-93-9)",
                "Cembrene (CAS: 25283-05-6)",
                "Cembrenoid",
                "Clerodane (CAS: 22558-56-7)",
                "Cryptotanshinone (CAS: 33855-05-5)",
                "Cubebol (CAS: 474-51-1)",
                "Daphnane (CAS: 546-71-2)",
                "Forskolin (CAS: 66558-72-9)",
                "Ginkgolide A (CAS: 113167-80-9)",
                "Ginkgolide B (CAS: 113167-81-0)",
                "Ginkgolide C (CAS: 113167-82-1)",
                "Ginkgolide J (CAS: 113167-83-2)",
                "Ginkgolide M (CAS: 113167-84-3)",
                "Isosteviol (CAS: 16931-31-0)",
                "Lycopodine (CAS: 523-58-6)",
                "Paclitaxel (CAS: 33069-62-4)",
                "Phorbol (CAS: 17088-81-6)",
                "Phorbol-12-myristate-13-acetate (CAS: 16561-29-8)",
                "Podolactone (CAS: 22558-56-7)",
                "Sclareol (CAS: 533-86-4)",
                "Steviol (CAS: 34294-10-9)"
            ],
            "true_referents": [
                "(-)-spiroviolene",
                "(R)-cembrene A",
                "(R)-nephthenol",
                "(S)-axinyssene",
                "11-oxomiltiradiene",
                "15,16-epoxydolabrene",
                "16alpha-hydroxy-ent-kaurene",
                "3beta-hydroxy-15,16-epoxydolabrene",
                "4,8-dihydroxycasbene",
                "4-hydroxy-8-oxocasbene",
                "5,8-dihydroxy-4-oxocasbene",
                "Rhodojaponin III",
                "abieta-7,13-diene",
                "abieta-8(14),12-diene",
                "abietadiene",
                "abietane",
                "abietatriene",
                "alpha-camphorene",
                "axerophthene",
                "cembrene C",
                "delta-araneosene",
                "dolabella-3,7,12-triene",
                "dolabella-3,7,18-triene",
                "ent-cassa-12,15-diene",
                "ent-gibberellane",
                "ent-isokaurene",
                "ent-kaurene",
                "gamma-camphorene",
                "kaurane",
                "labdane",
                "lycosantalene",
                "lydicene",
                "neophytadiene",
                "phomacta-1(15),3,7-triene",
                "rhizathalene A",
                "sclarene",
                "serratol",
                "spiroluchuene A",
                "spiroluchuene B",
                "taxa-4,11-diene",
                "taxane"
            ],
            "TP": 2,
            "FP": 23,
            "FN": 0
        }
    },
    {
        "test": "limited-list-referents",
        "responder": "gemma-3",
        "concept": "diterpene",
        "domain": "chemistry",
        "response": [
            "Phytol (Phytol)",
            "Abietic acid (Abietic acid)",
            "Steviol (Steviol)",
            "Gibberellic acid (GA3)",
            "Taxol/Paclitaxel (Paclitaxel)",
            "Camphene (Camphene)",
            "Manool (Manool)",
            "Pulegone (Pulegone)",
            "Forskolin (Forskolin)",
            "Geranylgeraniol (GGOH)",
            "Sclareol (Sclareol)",
            "Dolichol (Dolichol)",
            "Retinol (Vitamin A, Retinol)",
            "Vitamin K1/Phylloquinone (Phylloquinone)",
            "Copalol (Copalol)",
            "Stemodone (Stemodone)",
            "Maytenine (Maytenine)",
            "Pinusol (Pinusol)",
            "Salvinorin A (Salvinorin A)",
            "Teucrium scordium oil constituents (Teucrium oil)",
            "Maitotoxin (Maitotoxin)",
            "Pimaric acid (Pimaric acid)",
            "Scopolamine (Scopolamine)",
            "Atropine (Atropine)"
        ],
        "scorer": "gpt-4o",
        "judgement": {
            "matches": [],
            "mismatches": [
                "Phytol (Phytol)",
                "Abietic acid (Abietic acid)",
                "Steviol (Steviol)",
                "Gibberellic acid (GA3)",
                "Taxol/Paclitaxel (Paclitaxel)",
                "Camphene (Camphene)",
                "Manool (Manool)",
                "Pulegone (Pulegone)",
                "Forskolin (Forskolin)",
                "Geranylgeraniol (GGOH)",
                "Sclareol (Sclareol)",
                "Dolichol (Dolichol)",
                "Retinol (Vitamin A, Retinol)",
                "Vitamin K1/Phylloquinone (Phylloquinone)",
                "Copalol (Copalol)",
                "Stemodone (Stemodone)",
                "Maytenine (Maytenine)",
                "Pinusol (Pinusol)",
                "Salvinorin A (Salvinorin A)",
                "Teucrium scordium oil constituents (Teucrium oil)",
                "Maitotoxin (Maitotoxin)",
                "Pimaric acid (Pimaric acid)",
                "Scopolamine (Scopolamine)",
                "Atropine (Atropine)"
            ],
            "true_referents": [
                "(-)-spiroviolene",
                "(R)-nephthenol",
                "(S)-axinyssene",
                "3beta-hydroxy-15,16-epoxydolabrene",
                "4-hydroxycasbene",
                "8-hydroxycasbene",
                "9-deoxy-hymatoxin A",
                "abieta-7,13-diene",
                "abieta-8(14),12-diene",
                "abietatriene",
                "alpha-camphorene",
                "beta-pinacene",
                "catenul-14-en-6-ol",
                "delta-araneosene",
                "dolabella-3,7,12-triene",
                "dolabella-3,7,18-triene",
                "ent-gibberellane",
                "ent-pimara-9(11),15-diene",
                "erinacol",
                "gamma-camphorene",
                "gibberellane",
                "grayanotoxane",
                "kanakugiol",
                "labdane",
                "phyllocladan-16alpha-ol",
                "phytane",
                "pimara-8(14),15-diene",
                "pimaradiene",
                "pimarane",
                "rosane",
                "sclarene",
                "serratol",
                "sobralene",
                "stemar-13-ene",
                "stemod-13(17)-ene",
                "taxane",
                "terpentetriene",
                "tigliane"
            ],
            "TP": 0,
            "FP": 24,
            "FN": 0
        }
    },
    {
        "test": "limited-list-referents",
        "responder": "gpt-4o",
        "concept": "diterpene",
        "domain": "chemistry",
        "response": [
            "Phytol (C20H40O)",
            "Retinol (C20H30O)",
            "Taxadiene (C20H32)",
            "Steviol (C20H30O3)",
            "Ginkgolide (C20H24O9)",
            "Forskolin (C22H34O7)",
            "Abietic acid (C20H30O2)",
            "Labdane (C20H38)",
            "Sclareol (C20H36O2)",
            "Kaurene (C20H32)",
            "Manool (C20H34O2)",
            "Cafestol (C20H28O3)",
            "Eperu-8(20)-en-3\u03b1-ol (C20H34O)",
            "Pimaric acid (C20H30O2)",
            "Austroinulin (C20H34O2)",
            "Tanshinone IIA (C19H18O3)",
            "Carnosic acid (C20H28O4)",
            "Rosmarinic acid (C18H16O8)",
            "Biformene (C20H32)",
            "Totarol (C20H30O)",
            "Ginkgolide B (C20H24O10)",
            "Ginkgolide C (C20H24O11)",
            "Cryptotanshinone (C19H20O3)",
            "Juvabione (C20H34O2)"
        ],
        "scorer": "gpt-4o",
        "judgement": {
            "matches": [
                "Labdane"
            ],
            "mismatches": [
                "Phytol (C20H40O)",
                "Retinol (C20H30O)",
                "Taxadiene (C20H32)",
                "Steviol (C20H30O3)",
                "Ginkgolide (C20H24O9)",
                "Forskolin (C22H34O7)",
                "Abietic acid (C20H30O2)",
                "Sclareol (C20H36O2)",
                "Kaurene (C20H32)",
                "Manool (C20H34O2)",
                "Cafestol (C20H28O3)",
                "Eperu-8(20)-en-3\u03b1-ol (C20H34O)",
                "Pimaric acid (C20H30O2)",
                "Austroinulin (C20H34O2)",
                "Tanshinone IIA (C19H18O3)",
                "Carnosic acid (C20H28O4)",
                "Rosmarinic acid (C18H16O8)",
                "Biformene (C20H32)",
                "Totarol (C20H30O)",
                "Ginkgolide B (C20H24O10)",
                "Ginkgolide C (C20H24O11)",
                "Cryptotanshinone (C19H20O3)",
                "Juvabione (C20H34O2)"
            ],
            "true_referents": [
                "(12E)-labda-8(17),12,14-triene",
                "(R)-nephthenol",
                "(Z)-biformene",
                "16alpha-hydroxy-ent-kaurene",
                "3beta-hydroxy-15,16-epoxydolabrene",
                "4,5,8-trihydroxycasbene",
                "4,8-dihydroxycasbene",
                "4-hydroxy-8-oxocasbene",
                "4-hydroxycasbene",
                "5,8-dihydroxy-4-oxocasbene",
                "8-hydroxycasbene",
                "9beta-pimara-7,15-diene",
                "abieta-7,13-diene",
                "abieta-8(14),12-diene",
                "abietatriene",
                "beta-pinacene",
                "cephalot-3(20)-ene",
                "dolabella-3,7,12-triene",
                "dolabella-3,7,18-triene",
                "ent-cassa-12,15-diene",
                "ent-isokaurene",
                "ent-kaurene",
                "ent-pimara-8(14),15-diene",
                "ent-pimara-9(11),15-diene",
                "isopimara-8(14),15-diene",
                "labdane",
                "phomacta-1(15),3,7-triene",
                "phyllocladan-16alpha-ol",
                "phytane",
                "pimara-8(14),15-diene",
                "pimarane",
                "sclarene",
                "serratol",
                "syn-isopimara-7,15-diene",
                "syn-labda-8(17),12E,14-triene",
                "taxa-4,11-diene",
                "taxa-420,1112-diene",
                "taxane"
            ],
            "TP": 1,
            "FP": 23,
            "FN": 0
        }
    },
    {
        "test": "limited-list-referents",
        "responder": "gpt-4o-mini",
        "concept": "diterpene",
        "domain": "chemistry",
        "response": [
            "Taxol (paclitaxel)",
            "Rosmarinic acid",
            "Carnosic acid",
            "Ginkgolides (ginkgolide A)",
            "Forskolin",
            "Cafestol",
            "Abietic acid",
            "Podophyllotoxin",
            "Caryophyllene",
            "Diterpene resin acids",
            "Jatrophane",
            "Borneol",
            "Sclareol",
            "Cembrene",
            "Diterpene glycosides",
            "Phytol",
            "Labdanes",
            "Steviol",
            "Ent-kaurenoic acid",
            "Cafestol",
            "Gibberellins (GA)",
            "Tanshinone IIA",
            "Clerodane",
            "Cyclic diterpenes"
        ],
        "scorer": "gpt-4o",
        "judgement": {
            "matches": [],
            "mismatches": [
                "Taxol (paclitaxel)",
                "Rosmarinic acid",
                "Carnosic acid",
                "Ginkgolides (ginkgolide A)",
                "Forskolin",
                "Cafestol",
                "Abietic acid",
                "Podophyllotoxin",
                "Caryophyllene",
                "Diterpene resin acids",
                "Jatrophane",
                "Borneol",
                "Sclareol",
                "Cembrene",
                "Diterpene glycosides",
                "Phytol",
                "Labdanes",
                "Steviol",
                "Ent-kaurenoic acid",
                "Gibberellins (GA)",
                "Tanshinone IIA",
                "Clerodane",
                "Cyclic diterpenes"
            ],
            "true_referents": [
                "(-)-spiroviolene",
                "(R)-cembrene A",
                "(R)-nephthenol",
                "16alpha-hydroxy-ent-kaurene",
                "4,5,8-trihydroxycasbene",
                "4,8-dihydroxycasbene",
                "4-hydroxycasbene",
                "5,8-dihydroxy-4-oxocasbene",
                "8-hydroxycasbene",
                "Rhodojaponin III",
                "abieta-7,13-diene",
                "abieta-8(14),12-diene",
                "abietane",
                "abietatriene",
                "alpha-camphorene",
                "beta-pinacene",
                "casbene",
                "cembrene C",
                "collinodiene",
                "dihydroserrulatene",
                "dolabella-3,7,12-triene",
                "dolabella-3,7,18-triene",
                "ent-gibberellane",
                "ent-isokaurene",
                "ent-kaurene",
                "gibberellane",
                "labda-7,13(16),14-triene",
                "labdane",
                "lydicene",
                "multidienyl diphosphate(3-)",
                "neophytadiene",
                "phomopsene",
                "phyllocladan-16alpha-ol",
                "phytane",
                "rhizathalene A",
                "rosane",
                "sclarene",
                "serratol",
                "sobralene",
                "spiroluchuene A",
                "taxane",
                "terpentetriene",
                "tsukubadiene"
            ],
            "TP": 0,
            "FP": 23,
            "FN": 0
        }
    },
    {
        "test": "limited-list-referents",
        "responder": "gpt-4-32k",
        "concept": "diterpene",
        "domain": "chemistry",
        "response": [
            "Carnosic Acid (CA)",
            "Carnosol (CS)",
            "Abietic Acid (AA)",
            "Dehydroabietic Acid (DAA)",
            "Rosin (RS)",
            "Sclareol (SL)",
            "Cembrene (CB)",
            "Phytol (PT)",
            "Taxol (TX)",
            "Retinol (RT)",
            "Kahweol (KW)",
            "Cafestol (CF)",
            "Salvinorin A (SA)",
            "Gibberellic Acid (GA)",
            "Steviol (SV)",
            "Casbene (CB)",
            "Jatrophone (JT)",
            "Oridonin (OR)",
            "Pimaric Acid (PA)",
            "Levopimaric Acid (LA)",
            "Isopimaric Acid (IA)",
            "Deoxypodophyllotoxin (DP)",
            "Cyclopentanoperhydrophenanthrene (CPP)",
            "Geranylgeraniol (GG)"
        ],
        "scorer": "gpt-4o",
        "judgement": {
            "matches": [
                "Casbene"
            ],
            "mismatches": [
                "Carnosic Acid (CA)",
                "Carnosol (CS)",
                "Abietic Acid (AA)",
                "Dehydroabietic Acid (DAA)",
                "Rosin (RS)",
                "Sclareol (SL)",
                "Cembrene (CB)",
                "Phytol (PT)",
                "Taxol (TX)",
                "Retinol (RT)",
                "Kahweol (KW)",
                "Cafestol (CF)",
                "Salvinorin A (SA)",
                "Gibberellic Acid (GA)",
                "Steviol (SV)",
                "Jatrophone (JT)",
                "Oridonin (OR)",
                "Pimaric Acid (PA)",
                "Levopimaric Acid (LA)",
                "Isopimaric Acid (IA)",
                "Deoxypodophyllotoxin (DP)",
                "Cyclopentanoperhydrophenanthrene (CPP)",
                "Geranylgeraniol (GG)"
            ],
            "true_referents": [
                "(-)-casbene",
                "(-)-spiroviolene",
                "(R)-axinyssene",
                "(R)-cembrene A",
                "(R)-nephthenol",
                "(S)-axinyssene",
                "16alpha-hydroxy-ent-kaurene",
                "4,5,8-trihydroxycasbene",
                "4-hydroxycasbene",
                "8-hydroxycasbene",
                "9beta-pimara-7,15-diene",
                "Rhodojaponin III",
                "abieta-7,13-diene",
                "abieta-8(14),12-diene",
                "abietatriene",
                "alpha-camphorene",
                "casbane",
                "casbene",
                "cembrene C",
                "cephalot-3(20)-ene",
                "ent-atiserene",
                "ent-cassa-12,15-diene",
                "ent-gibberellane",
                "ent-kaurane",
                "ent-trachyloban-3beta-ol",
                "ent-trachylobane",
                "gibberellane",
                "grayanotoxane",
                "isopimara-7,15-diene",
                "isopimara-8(14),15-diene",
                "isopimarane",
                "kanakugiol",
                "multidienyl diphosphate(3-)",
                "neoabietadiene",
                "neophytadiene",
                "phyllocladan-16alpha-ol",
                "phytane",
                "pimara-8(14),15-diene",
                "pimarane",
                "rhizathalene A",
                "rosane",
                "sclarene",
                "serratol",
                "sobralene",
                "spiroalbatene",
                "taxa-4,11-diene",
                "taxa-420,1112-diene",
                "taxane",
                "terpentetriene",
                "verticilla-3,7,11(12)-triene"
            ],
            "TP": 1,
            "FP": 23,
            "FN": 0
        }
    },
    {
        "test": "limited-list-referents",
        "responder": "gpt-35-turbo-16k",
        "concept": "diterpene",
        "domain": "chemistry",
        "response": [
            "Taxol (paclitaxel)",
            "Gibberellin A1",
            "Forskolin",
            "Artemisinin",
            "Rosmarinic acid",
            "Ginkgolide B",
            "Carnosic acid",
            "Caffeic acid",
            "Salvinorin A",
            "Carnosol",
            "Neuroprotectin D1",
            "Crotalaria diterpenoid",
            "Retinol (vitamin A)",
            "Ginsenoside Rb1",
            "Sclareol",
            "Thapsigargin",
            "Guggulsterone",
            "Retinoic acid",
            "Colchicine",
            "Abietic acid",
            "Carvacrol",
            "Limonene",
            "Cannabidiol (CBD)",
            "Brevicomin"
        ],
        "scorer": "gpt-4o",
        "judgement": {
            "matches": [],
            "mismatches": [
                "Taxol (paclitaxel)",
                "Gibberellin A1",
                "Forskolin",
                "Artemisinin",
                "Rosmarinic acid",
                "Ginkgolide B",
                "Carnosic acid",
                "Caffeic acid",
                "Salvinorin A",
                "Carnosol",
                "Neuroprotectin D1",
                "Crotalaria diterpenoid",
                "Retinol (vitamin A)",
                "Ginsenoside Rb1",
                "Sclareol",
                "Thapsigargin",
                "Guggulsterone",
                "Retinoic acid",
                "Colchicine",
                "Abietic acid",
                "Carvacrol",
                "Limonene",
                "Cannabidiol (CBD)",
                "Brevicomin"
            ],
            "true_referents": [
                "(-)-spiroviolene",
                "(R)-axinyssene",
                "(R)-nephthenol",
                "(S)-axinyssene",
                "11-oxomiltiradiene",
                "4,5,8-trihydroxycasbene",
                "4-hydroxycasbene",
                "5,8-dihydroxy-4-oxocasbene",
                "8-hydroxycasbene",
                "9-deoxy-hymatoxin A",
                "Rhodojaponin III",
                "abieta-7,13-diene",
                "abieta-8(14),12-diene",
                "abietatriene",
                "alpha-camphorene",
                "axerophthene",
                "beta-araneosene",
                "beta-pinacene",
                "delta-araneosene",
                "dihydroserrulatene",
                "ent-atiserene",
                "ent-gibberellane",
                "gamma-camphorene",
                "gibberellane",
                "isocatenula-2,14-diene",
                "kanakugiol",
                "multidienyl diphosphate(3-)",
                "neophytadiene",
                "phomopsene",
                "phyllocladan-16alpha-ol",
                "phytane",
                "rhizathalene A",
                "rosane",
                "sclarene",
                "serratol",
                "sobralene",
                "spiroalbatene",
                "spiroluchuene A",
                "spiroluchuene B",
                "stemod-13(17)-ene",
                "taxa-420,1112-diene",
                "taxane",
                "verticilla-3,7,11(12)-triene"
            ],
            "TP": 0,
            "FP": 24,
            "FN": 0
        }
    },
    {
        "test": "limited-list-referents",
        "responder": "o1-mini",
        "concept": "diterpene",
        "domain": "chemistry",
        "response": [
            "Taxol (paclitaxel)",
            "Forskolin",
            "Ginkgolide B",
            "Abietic acid",
            "Gibberellin A4",
            "Phorbol",
            "Kaurene",
            "Retinol",
            "Pimaric acid",
            "Ingenol",
            "Steviol",
            "Andrographolide",
            "Casbene",
            "Serjanic acid",
            "Podojokiol",
            "Manool",
            "Diosgenin",
            "Neopimaric acid",
            "Isopimaric acid",
            "Totarol",
            "Sclareol",
            "Labdanic acid",
            "Diplopimaric acid",
            "Manoyl oxide"
        ],
        "scorer": "gpt-4o",
        "judgement": {
            "matches": [
                "Kaurene",
                "Casbene"
            ],
            "mismatches": [
                "Taxol (paclitaxel)",
                "Forskolin",
                "Ginkgolide B",
                "Abietic acid",
                "Gibberellin A4",
                "Phorbol",
                "Retinol",
                "Pimaric acid",
                "Ingenol",
                "Steviol",
                "Andrographolide",
                "Serjanic acid",
                "Podojokiol",
                "Manool",
                "Diosgenin",
                "Neopimaric acid",
                "Isopimaric acid",
                "Totarol",
                "Sclareol",
                "Labdanic acid",
                "Diplopimaric acid",
                "Manoyl oxide"
            ],
            "true_referents": [
                "(-)-casbene",
                "(-)-spiroviolene",
                "(R)-nephthenol",
                "11-oxomiltiradiene",
                "15,16-epoxydolabrene",
                "3beta-hydroxy-15,16-epoxydolabrene",
                "4,8-dihydroxycasbene",
                "5,8-dihydroxy-4-oxocasbene",
                "8-hydroxycasbene",
                "Rhodojaponin III",
                "abieta-7,13-diene",
                "abieta-8(14),12-diene",
                "abietane",
                "abietatriene",
                "beta-araneosene",
                "beta-pinacene",
                "casbane",
                "casbene",
                "delta-araneosene",
                "ent-gibberellane",
                "ent-kaurane",
                "ent-kaurene",
                "erinacol",
                "gibberellane",
                "halimane",
                "isopimara-7,15-diene",
                "isopimara-8(14),15-diene",
                "isopimarane",
                "kanakugiol",
                "kaurane",
                "labda-7,13(16),14-triene",
                "labdane",
                "multidienyl diphosphate(3-)",
                "neophytadiene",
                "phomopsene",
                "phyllocladan-16alpha-ol",
                "phytane",
                "pimara-8(14),15-diene",
                "pimaradiene",
                "pimarane",
                "prenylkelsoene",
                "rhizathalene A",
                "sclarene",
                "serratol",
                "sobralene",
                "spiroalbatene",
                "spiroluchuene A",
                "spiroluchuene B",
                "stemod-13(17)-ene",
                "syn-labda-8(17),12E,14-triene",
                "taxane"
            ],
            "TP": 2,
            "FP": 22,
            "FN": 0
        }
    },
    {
        "test": "limited-list-referents",
        "responder": "anthropic.claude-3-5-sonnet-v1:0",
        "concept": "diterpene",
        "domain": "chemistry",
        "response": [
            "Taxol (Paclitaxel)",
            "Ginkgolide A",
            "Forskolin",
            "Cafestol",
            "Steviol",
            "Phytol",
            "Gibberellic acid (GA3)",
            "Abietic acid",
            "Carnosic acid",
            "Cembrene",
            "Kahweol",
            "Marrubin",
            "Phorbol",
            "Salvinorin A",
            "Tanshinone IIA",
            "Andrographolide",
            "Eleutherobin",
            "Ingenol",
            "Jatrophane",
            "Lathyrane",
            "Oridonin",
            "Pleuromutilin",
            "Triptolide",
            "Zealexin A1"
        ],
        "scorer": "gpt-4o",
        "judgement": {
            "matches": [
                "cembrene"
            ],
            "mismatches": [
                "Taxol (Paclitaxel)",
                "Ginkgolide A",
                "Forskolin",
                "Cafestol",
                "Steviol",
                "Phytol",
                "Gibberellic acid (GA3)",
                "Abietic acid",
                "Carnosic acid",
                "Kahweol",
                "Marrubin",
                "Phorbol",
                "Salvinorin A",
                "Tanshinone IIA",
                "Andrographolide",
                "Eleutherobin",
                "Ingenol",
                "Jatrophane",
                "Lathyrane",
                "Oridonin",
                "Pleuromutilin",
                "Triptolide",
                "Zealexin A1"
            ],
            "true_referents": [
                "(-)-spiroviolene",
                "(R)-axinyssene",
                "(R)-cembrene A",
                "(R)-nephthenol",
                "(S)-axinyssene",
                "(Z)-biformene",
                "15,16-epoxydolabrene",
                "3beta-hydroxy-15,16-epoxydolabrene",
                "4-hydroxycasbene",
                "8-hydroxycasbene",
                "9-deoxy-hymatoxin A",
                "Rhodojaponin III",
                "abieta-7,13-diene",
                "abieta-8(14),12-diene",
                "abietane",
                "abietatriene",
                "alpha-camphorene",
                "casbene",
                "cembrane",
                "cembrene C",
                "dihydroserrulatene",
                "ent-gibberellane",
                "ent-kaurane",
                "ent-trachyloban-3beta-ol",
                "ent-trachylobane",
                "erinacol",
                "gibberellane",
                "isoelisabethatriene",
                "kanakugiol",
                "kaurane",
                "labda-7,13(16),14-triene",
                "phomopsene",
                "phyllocladan-16alpha-ol",
                "phytane",
                "rhizathalene A",
                "rosane",
                "serratol",
                "serrulatane",
                "spiroalbatene",
                "spiroluchuene A",
                "spiroluchuene B",
                "syn-labda-8(17),12E,14-triene",
                "taxane",
                "tsukubadiene"
            ],
            "TP": 1,
            "FP": 23,
            "FN": 0
        }
    },
    {
        "test": "limited-list-referents",
        "responder": "anthropic.claude-3-opus-v1:0",
        "concept": "diterpene",
        "domain": "chemistry",
        "response": [
            "Taxol (Paclitaxel)",
            "Forskolin",
            "Triptolide",
            "Ingenol",
            "Prostratin",
            "Stevioside",
            "Cafestol",
            "Kahweol",
            "Phytol",
            "Abietic acid",
            "Gibberellin A1 (GA1)",
            "Kaurene",
            "Sclareol",
            "Carnosic acid",
            "Carnosol",
            "Ferruginol",
            "Totarol",
            "Salvinorin A",
            "Ginkgolide A",
            "Ginkgolide B",
            "Bilobalide",
            "Andrographolide",
            "Copalic acid",
            "Kaurenoic acid"
        ],
        "scorer": "gpt-4o",
        "judgement": {
            "matches": [
                "kaurene"
            ],
            "mismatches": [
                "Taxol (Paclitaxel)",
                "Forskolin",
                "Triptolide",
                "Ingenol",
                "Prostratin",
                "Stevioside",
                "Cafestol",
                "Kahweol",
                "Phytol",
                "Abietic acid",
                "Gibberellin A1 (GA1)",
                "Sclareol",
                "Carnosic acid",
                "Carnosol",
                "Ferruginol",
                "Totarol",
                "Salvinorin A",
                "Ginkgolide A",
                "Ginkgolide B",
                "Bilobalide",
                "Andrographolide",
                "Copalic acid",
                "Kaurenoic acid"
            ],
            "true_referents": [
                "(-)-spiroviolene",
                "(R)-nephthenol",
                "(Z)-biformene",
                "11-O-acetylcyathin A3",
                "15,16-epoxydolabrene",
                "16alpha-hydroxy-ent-kaurene",
                "3beta-hydroxy-15,16-epoxydolabrene",
                "4-hydroxycasbene",
                "5,8-dihydroxy-4-oxocasbene",
                "8-hydroxycasbene",
                "abieta-7,13-diene",
                "abieta-8(14),12-diene",
                "abietatriene",
                "alpha-camphorene",
                "beta-pinacene",
                "dihydroserrulatene",
                "dolabella-3,7,12-triene",
                "ent-gibberellane",
                "ent-isokaurene",
                "ent-kaurane",
                "ent-kaurene",
                "ent-trachyloban-3beta-ol",
                "erinacol",
                "gibberellane",
                "kanakugiol",
                "kaurane",
                "phomopsene",
                "phyllocladan-16alpha-ol",
                "phytane",
                "rhizathalene A",
                "sclarene",
                "serratol",
                "sobralene",
                "spiroalbatene",
                "spiroluchuene A",
                "spiroluchuene B",
                "taxane"
            ],
            "TP": 1,
            "FP": 23,
            "FN": 0
        }
    },
    {
        "test": "limited-list-referents",
        "responder": "anthropic.claude-3-sonnet-v1:0",
        "concept": "diterpene",
        "domain": "chemistry",
        "response": [
            "Phytol (PYT)",
            "Retinol (ROL)",
            "Taxadiene (TAX)",
            "Cafestol (CAF)",
            "Kahweol (KAW)",
            "Geranylgeraniol (GGO)",
            "Gibberellin A3 (GA3)",
            "Abietadiene (ABI)",
            "Cembrene A (CEM)",
            "Forskolin (FOR)",
            "Triptolide (TRI)",
            "Steviol (STE)",
            "Andrographolide (AND)",
            "Carnosic acid (CAR)",
            "Abietic acid (ABA)",
            "Dehydroabietic acid (DHA)",
            "Betulinic acid (BET)",
            "Ingenol (ING)",
            "Jatrophane (JAT)",
            "Latilagascene (LAT)",
            "Marrubiin (MAR)",
            "Miltirone (MIL)",
            "Phorbol (PHO)",
            "Tripterin (TRP)"
        ],
        "scorer": "gpt-4o",
        "judgement": {
            "matches": [
                "Abietadiene"
            ],
            "mismatches": [
                "Phytol (PYT)",
                "Retinol (ROL)",
                "Taxadiene (TAX)",
                "Cafestol (CAF)",
                "Kahweol (KAW)",
                "Geranylgeraniol (GGO)",
                "Gibberellin A3 (GA3)",
                "Cembrene A (CEM)",
                "Forskolin (FOR)",
                "Triptolide (TRI)",
                "Steviol (STE)",
                "Andrographolide (AND)",
                "Carnosic acid (CAR)",
                "Abietic acid (ABA)",
                "Dehydroabietic acid (DHA)",
                "Betulinic acid (BET)",
                "Ingenol (ING)",
                "Jatrophane (JAT)",
                "Latilagascene (LAT)",
                "Marrubiin (MAR)",
                "Miltirone (MIL)",
                "Phorbol (PHO)",
                "Tripterin (TRP)"
            ],
            "true_referents": [
                "(-)-casbene",
                "(-)-spiroviolene",
                "(R)-axinyssene",
                "(R)-cembrene A",
                "(R)-nephthenol",
                "(Z)-biformene",
                "16alpha-hydroxy-ent-kaurene",
                "3beta-hydroxy-15,16-epoxydolabrene",
                "4-hydroxycasbene",
                "8-hydroxycasbene",
                "9beta-pimara-7,15-diene",
                "Rhodojaponin III",
                "abieta-7,13-diene",
                "abieta-8(14),12-diene",
                "abietadiene",
                "abietane",
                "abietatriene",
                "beta-pinacene",
                "cembrane",
                "cembrene C",
                "dihydroserrulatene",
                "ent-(12E)-labda-8(17),12,14-triene",
                "ent-gibberellane",
                "ent-kaurane",
                "ent-sandaracopimara-8(14),15-diene",
                "ent-trachyloban-3beta-ol",
                "ent-trachylobane",
                "erinacol",
                "gibberellane",
                "grayanotoxane",
                "kanakugiol",
                "labda-7,13(16),14-triene",
                "miltiradien-20-al",
                "miltiradiene",
                "phomacta-1(15),3,7-triene",
                "phomopsene",
                "phyllocladan-16alpha-ol",
                "phytane",
                "rhizathalene A",
                "serratol",
                "serrulatane",
                "stemod-13(17)-ene",
                "taxa-4,11-diene",
                "taxa-420,1112-diene",
                "taxane",
                "terpentetriene"
            ],
            "TP": 1,
            "FP": 23,
            "FN": 0
        }
    },
    {
        "test": "limited-list-referents",
        "responder": "anthropic.claude-3-haiku-v1:0",
        "concept": "diterpene",
        "domain": "chemistry",
        "response": [
            "Abietic acid (C20H30O2)",
            "Abietinol (C20H32O)",
            "Abietol (C20H34O)",
            "Cafestol (C20H28O3)",
            "Camptothecin (C20H16N2O4)",
            "Cembrene (C20H32)",
            "Coleon U (C20H28O3)",
            "Copalol (C20H34O)",
            "Cryptotanshinone (C19H20O3)",
            "Dehydroabietinal (C20H28O)",
            "Forskolin (C22H34O7)",
            "Gibberellic acid (C19H22O6)",
            "Ginkgolide A (C20H24O6)",
            "Ginkgolide B (C20H24O7)",
            "Ginkgolide C (C20H24O8)",
            "Ginkgolide J (C20H24O7)",
            "Kaurane (C20H32)",
            "Kaurenoic acid (C20H30O2)",
            "Manoyl oxide (C20H34O)",
            "Phytol (C20H40O)",
            "Pimaric acid (C20H30O2)",
            "Sclareol (C20H36O2)",
            "Steviol (C20H30O3)",
            "Tanshinone I (C18H12O3)"
        ],
        "scorer": "gpt-4o",
        "judgement": {
            "matches": [
                "kaurane"
            ],
            "mismatches": [
                "Abietic acid (C20H30O2)",
                "Abietinol (C20H32O)",
                "Abietol (C20H34O)",
                "Cafestol (C20H28O3)",
                "Camptothecin (C20H16N2O4)",
                "Cembrene (C20H32)",
                "Coleon U (C20H28O3)",
                "Copalol (C20H34O)",
                "Cryptotanshinone (C19H20O3)",
                "Dehydroabietinal (C20H28O)",
                "Forskolin (C22H34O7)",
                "Gibberellic acid (C19H22O6)",
                "Ginkgolide A (C20H24O6)",
                "Ginkgolide B (C20H24O7)",
                "Ginkgolide C (C20H24O8)",
                "Ginkgolide J (C20H24O7)",
                "Kaurenoic acid (C20H30O2)",
                "Manoyl oxide (C20H34O)",
                "Phytol (C20H40O)",
                "Pimaric acid (C20H30O2)",
                "Sclareol (C20H36O2)",
                "Steviol (C20H30O3)",
                "Tanshinone I (C18H12O3)"
            ],
            "true_referents": [
                "(1Z,2Z,6E,10E)-pinacene",
                "(R)-cembrene A",
                "(R)-nephthenol",
                "(Z)-biformene",
                "16alpha-hydroxy-ent-kaurene",
                "3beta-hydroxy-15,16-epoxydolabrene",
                "4,5,8-trihydroxycasbene",
                "4,8-dihydroxycasbene",
                "4-hydroxy-8-oxocasbene",
                "4-hydroxycasbene",
                "5,8-dihydroxy-4-oxocasbene",
                "8-hydroxycasbene",
                "9beta-pimara-7,15-diene",
                "abieta-7,13-diene",
                "abieta-8(14),12-diene",
                "abietatriene",
                "alpha-camphorene",
                "cembrene C",
                "dolabella-3,7,12-triene",
                "dolabella-3,7,18-triene",
                "ent-cassa-12,15-diene",
                "ent-gibberellane",
                "ent-isokaurene",
                "ent-kaurane",
                "ent-pimara-9(11),15-diene",
                "gibberellane",
                "kaurane",
                "labda-7,13(16),14-triene",
                "phomacta-1(15),3,7-triene",
                "phyllocladan-16alpha-ol",
                "phytane",
                "pimara-8(14),15-diene",
                "pimarane",
                "sclarene",
                "serratol",
                "stemod-13(17)-ene",
                "taxane"
            ],
            "TP": 1,
            "FP": 23,
            "FN": 0
        }
    },
    {
        "test": "limited-list-referents",
        "responder": "meta.llama3-8b-instruct-v1:0",
        "concept": "diterpene",
        "domain": "chemistry",
        "response": "[\n  \"Abiesklasonine (AbiK)\", \n  \"Abietadiene (AbiD)\", \n  \"Abietatriene (AbiT)\", \n  \"Abrasins A and B\", \n  \"Abrasins C and D\", \n  \"Abrasins E and F\", \n  \"Abrasins G and H\", \n  \"Abrasins I and J\", \n  \"Abrasins K and L\", \n  \"Abrasins M and N\", \n  \"Abrasins O and P\", \n  \"Abrasins Q and R\", \n  \"Abrasins S and T\", \n  \"Abrasins U and V\", \n  \"Abrasins W and X\", \n  \"Abrasins Y and Z\", \n  \"Cembratrienol (CemT)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembranoid (Cem)\", \n  \"Cembranolide (CemL)\", \n  \"Cembranone (CemN)\", \n  \"Cembratrienolide (CemT)\", \n  \"Cembratrienone\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone (CemN)\", \n  \"Cembratrienone",
        "scorer": "gpt-4o",
        "judgement": {
            "TP": 0,
            "FP": 0
        }
    },
    {
        "test": "limited-list-referents",
        "responder": "meta.llama3-70b-instruct-v1:0",
        "concept": "diterpene",
        "domain": "chemistry",
        "response": [
            "Abietic acid (ABA)",
            "Caspase-3 inhibitor (C3I)",
            "Crotonkinin C",
            "Forskolin",
            "Ganoderic acid A",
            "Ganoderic acid B",
            "Ganoderic acid C",
            "Ganoderic acid D",
            "Ganoderic acid E",
            "Ganoderic acid F",
            "Ganoderic acid G",
            "Ganoderic acid H",
            "Ganoderic acid I",
            "Ganoderic acid J",
            "Ganoderic acid K",
            "Ganoderic acid L",
            "Ganoderic acid M",
            "Ganoderic acid N",
            "Ganoderic acid O",
            "Ganoderic acid P",
            "Ganoderic acid Q",
            "Ganoderic acid R",
            "Ganoderic acid S",
            "Ganoderic acid T",
            "Insensole",
            "Isotaxiresinolide",
            "Stevoid",
            "Taxiresinolide"
        ],
        "scorer": "gpt-4o",
        "judgement": {
            "matches": [],
            "mismatches": [
                "Abietic acid (ABA)",
                "Caspase-3 inhibitor (C3I)",
                "Crotonkinin C",
                "Forskolin",
                "Ganoderic acid A",
                "Ganoderic acid B",
                "Ganoderic acid C",
                "Ganoderic acid D",
                "Ganoderic acid E",
                "Ganoderic acid F",
                "Ganoderic acid G",
                "Ganoderic acid H",
                "Ganoderic acid I",
                "Ganoderic acid J",
                "Ganoderic acid K",
                "Ganoderic acid L",
                "Ganoderic acid M",
                "Ganoderic acid N",
                "Ganoderic acid O",
                "Ganoderic acid P",
                "Ganoderic acid Q",
                "Ganoderic acid R",
                "Ganoderic acid S",
                "Ganoderic acid T",
                "Insensole",
                "Isotaxiresinolide",
                "Stevoid",
                "Taxiresinolide"
            ],
            "true_referents": [
                "(R)-axinyssene",
                "(R)-nephthenol",
                "11-O-acetylcyathin A3",
                "11-oxomiltiradiene",
                "16alpha-hydroxy-ent-kaurene",
                "4,5,8-trihydroxycasbene",
                "Rhodojaponin III",
                "abieta-7,13-diene",
                "abieta-8(14),12-diene",
                "abietatriene",
                "ent-gibberellane",
                "ent-isokaurene",
                "erinacine Q",
                "fusicocca-2,10(14)-diene",
                "gibberellane",
                "grayanotoxane",
                "multidienyl diphosphate(3-)",
                "neophytadiene",
                "phomopsene",
                "phytane",
                "rhizathalene A",
                "serratol",
                "terpentetriene"
            ],
            "TP": 0,
            "FP": 28,
            "FN": 0
        }
    },
    {
        "test": "limited-list-referents",
        "responder": "amazon.titan-text-express-v1",
        "concept": "diterpene",
        "domain": "chemistry",
        "response": [
            {
                "Canonical name": "abietadiene"
            },
            {
                "Canonical name": "{USERNAME}"
            },
            {
                "Canonical name": "{USERNAME}"
            },
            {
                "Canonical name": "{USERNAME}"
            },
            {
                "Canonical name": "{USERNAME}"
            },
            {
                "Canonical name": "{USERNAME}"
            },
            {
                "Canonical name": "{USERNAME}"
            },
            {
                "Canonical name": "{USERNAME}"
            },
            {
                "Canonical name": "{USERNAME}"
            },
            {
                "Canonical name": "{USERNAME}"
            },
            {
                "Canonical name": "{USERNAME}"
            },
            {
                "Canonical name": "{USERNAME}"
            },
            {
                "Canonical name": "{USERNAME}"
            },
            {
                "Canonical name": "{USERNAME}"
            },
            {
                "Canonical name": "{USERNAME}"
            },
            {
                "Canonical name": "{USERNAME}"
            },
            {
                "Canonical name": "{USERNAME}"
            },
            {
                "Canonical name": "{USERNAME}"
            },
            {
                "Canonical name": "{USERNAME}"
            },
            {
                "Canonical name": "{USERNAME}"
            },
            {
                "Canonical name": "{USERNAME}"
            },
            {
                "Canonical name": "{USERNAME}"
            },
            {
                "Canonical name": "{USERNAME}"
            },
            {
                "Canonical name": "{USERNAME}"
            },
            {
                "Canonical name": "{USERNAME}"
            },
            {
                "Canonical name": "{USERNAME}"
            }
        ],
        "scorer": "gpt-4o",
        "judgement": {
            "matches": [
                "abietadiene"
            ],
            "mismatches": [
                "{USERNAME}"
            ],
            "true_referents": [
                "(-)-casbene",
                "(S)-axinyssene",
                "abietadiene",
                "abietane",
                "abietatriene",
                "phyllocladan-16alpha-ol"
            ],
            "TP": 1,
            "FP": 1,
            "FN": 0
        }
    }
]