{
  "cells": [
    {
      "cell_type": "markdown",
      "metadata": {},
      "source": [
        "# 试卷名：全国甲卷 高考真题 【生物】学科\n",
        "\n",
        "## 题目编号：1\n",
        "## 题目标答\n",
        "C\n",
        "## GLM4 9B 模型输出\n",
        "\n",
        "首先分析选项A，病毒没有细胞结构，所以A错误。\n",
        "\n",
        "接着分析选项B，原核生物虽然没有线粒体，但部分原核生物含有有氧呼吸酶，也能进行有氧呼吸，所以B错误。\n",
        "\n",
        "然后分析选项C，哺乳动物同一个体中细胞的染色体数目有可能不同，如精子和卵细胞中染色体数目是体细胞的一半，所以C正确。\n",
        "\n",
        "最后分析选项D，小麦根细胞吸收离子消耗的ATP主要由线粒体产生，所以D错误。\n",
        "\n",
        "综上所述，正确答案是C。\n",
        "\n",
        "--------\n",
        "## 题目编号：2\n",
        "## 题目标答\n",
        "B\n",
        "## GLM4 9B 模型输出\n",
        "\n",
        "首先分析各个选项：\n",
        "\n",
        "A. 赤霉素可以诱导某些酶的合成促进种子萌发，这是正确的，因为赤霉素可以解除种子休眠，促进种子萌发。\n",
        "\n",
        "B. 单侧光下生长素的极性运输不需要载体蛋白，这是错误的。生长素的极性运输是主动运输，需要载体蛋白。\n",
        "\n",
        "C. 植物激素可与特异性受体结合调节基因表达，这是正确的。植物激素通过与细胞膜上的受体结合，将外界信号转化为细胞内信号，进而调节基因表达。\n",
        "\n",
        "D. 一种激素可通过诱导其他激素的合成发挥作用，这是正确的。例如，生长素可以诱导乙烯的合成。\n",
        "\n",
        "综上所述，错误的选项是B。\n",
        "\n",
        "答案：B。\n",
        "\n",
        "--------\n",
        "## 题目编号：3\n",
        "## 题目标答\n",
        "D\n",
        "## GLM4 9B 模型输出\n",
        "\n",
        "首先分析选项A，甲状腺激素受体分布于人体内几乎所有细胞，这是正确的。\n",
        "\n",
        "接着分析选项B，甲状腺激素可以提高机体神经系统的兴奋性，这也是正确的。\n",
        "\n",
        "再分析选项C，甲状腺激素分泌增加可使细胞代谢速率加快，这同样是正确的。\n",
        "\n",
        "最后分析选项D，甲状腺激素分泌不足会使血中TSH含量减少。这个选项是错误的，因为甲状腺激素分泌不足时，垂体会分泌更多的TSH来促进甲状腺激素的分泌，所以血中TSH含量会增加。\n",
        "\n",
        "综上所述，错误的选项是D。\n",
        "\n",
        "答案：D。\n",
        "\n",
        "--------\n",
        "## 题目编号：4（含图片）\n",
        "## 题目标答\n",
        "B\n",
        "## GLM4 9B 模型输出\n",
        "\n",
        "根据题目描述，我们可以分析如下：\n",
        "\n",
        "A. 甲数量的变化不会对丙数量产生影响\n",
        "这个选项是错误的。因为甲和丙之间存在数量变化关系，甲数量的变化很可能会对丙数量产生影响。\n",
        "\n",
        "B. 乙在该生态系统中既是捕食者又是被捕食者\n",
        "这个选项是正确的。因为乙既是甲的捕食者，也是丙的捕食者，所以乙既是捕食者又是被捕食者。\n",
        "\n",
        "C. 丙可能是初级消费者，也可能是次级消费者\n",
        "这个选项是错误的。因为丙是乙的捕食者，所以丙至少是次级消费者，不可能是初级消费者。\n",
        "\n",
        "D. 能量流动方向可能是甲→乙→丙，也可能是丙→乙→甲\n",
        "这个选项是错误的。能量流动的方向是从生产者到消费者，再到分解者，所以能量流动方向不可能是甲→乙→丙，也不可能是丙→乙→甲。\n",
        "\n",
        "综上所述，正确答案是B。\n",
        "\n",
        "--------\n",
        "## 题目编号：5\n",
        "## 题目标答\n",
        "A\n",
        "## GLM4 9B 模型输出\n",
        "\n",
        "首先，我们需要了解题目中提到的遗传规律。题目提到果蝇的翅型、体色和眼色性状由独立遗传的等位基因控制，其中弯翅、黄体和紫眼均为隐性性状。这意味着：\n",
        "\n",
        "- 翅型：弯翅（隐性）对直翅（显性）\n",
        "- 体色：黄体（隐性）对灰体（显性）\n",
        "- 眼色：紫眼（隐性）对红眼（显性）\n",
        "\n",
        "另外，控制灰体和黄体性状的基因位于X染色体上，这意味着这些性状的遗传与性别有关。\n",
        "\n",
        "现在我们来分析每个选项：\n",
        "\n",
        "A. 直翅黄体♀×弯翅灰体♂\n",
        "- 翅型：直翅♀（显性）×弯翅♂（隐性）→ F1代全为直翅\n",
        "- 体色：黄体♀（隐性）×灰体♂（显性）→ F1代全为灰体\n",
        "- 眼色：红眼♀（显性）×红眼♂（显性）→ F1代全为红眼\n",
        "- F2代：直翅灰体♀×直翅灰体♂，性状分离比为9∶3∶3∶1\n",
        "\n",
        "B. 直翅灰体♀×弯翅黄体♂\n",
        "- 翅型：直翅♀（显性）×弯翅♂（隐性）→ F1代全为直翅\n",
        "- 体色：灰体♀（显性）×黄体♂（隐性）→ F1代全为灰体\n",
        "- 眼色：红眼♀（显性）×红眼♂（显性）→ F1代全为红眼\n",
        "- F2代：直翅灰体♀×直翅灰体♂，性状分离比为9∶3∶3∶1\n",
        "\n",
        "C. 弯翅红眼♀×直翅紫眼♂\n",
        "- 翅型：弯翅♀（隐性）×直翅♂（显性）→ F1代全为直翅\n",
        "- 体色：红眼♀（显性）×紫眼♂（隐性）→ F1代全为红眼\n",
        "- 眼色：红眼♀（显性）×紫眼♂（隐性）→ F1代全为红眼\n",
        "- F2代：直翅红眼♀×直翅红眼♂，性状分离比为9∶3∶3∶1\n",
        "\n",
        "D. 灰体紫眼♀×黄体红眼♂\n",
        "- 翅型：灰体♀（显性）×黄体♂（隐性）→ F1代全为灰体\n",
        "- 体色：红眼♀（显性）×紫眼♂（隐性）→ F1代全为红眼\n",
        "- 眼色：红眼♀（显性）×紫眼♂（隐性）→ F1代全为红眼\n",
        "- F2代：灰体红眼♀×灰体红眼♂，性状分离比不符合9∶3∶3∶1，因为体色只有灰体一种表现型\n",
        "\n",
        "因此，F2的性状分离比不符合9∶3∶3∶1的亲本组合是D. 灰体紫眼♀×黄体红眼♂。\n",
        "\n",
        "--------\n",
        "## 题目编号：6（含图片）\n",
        "## 题目标答\n",
        "暂无\n",
        "## GLM4 9B 模型输出\n",
        "\n",
        "首先，我们来分析每个选项的正确性。\n",
        "\n",
        "A选项：ATP转化为ADP可为离子的主动运输提供能量。这是正确的，因为主动运输需要消耗能量，而ATP的水解可以提供这种能量。\n",
        "\n",
        "B选项：用α位<sup>32</sup>P标记的ATP可以合成带有<sup>32</sup>P的RNA。这也是正确的，因为ATP在细胞内可以参与RNA的合成过程，如果ATP的α位被标记，那么在RNA合成过程中，这些标记的磷酸基团可能会被转移到RNA分子上。\n",
        "\n",
        "C选项：β和γ位磷酸基团之间的高能磷酸键不能在细胞核中断裂。这是错误的，因为β和γ位磷酸基团之间的高能磷酸键可以在细胞核中断裂，例如在DNA复制和转录过程中，ATP可以提供能量。\n",
        "\n",
        "D选项：光合作用可将光能转化为化学能储存于β和γ位磷酸基团之间的高能磷酸键。这是正确的，光合作用确实可以将光能转化为化学能，并储存在ATP的高能磷酸键中。\n",
        "\n",
        "综上所述，错误的叙述是C选项。\n",
        "\n",
        "--------\n",
        "## 题目编号：7\n",
        "## 题目标答\n",
        "(1)(2) (3)\n",
        "## GLM4 9B 模型输出\n",
        "\n",
        "(1) 根据题目描述，用性状优良的水稻纯合体（甲）给某雄性不育水稻植株授粉，杂交子一代均表现雄性不育，说明雄性不育性状是由母本（甲）传递给子代的。杂交子一代与甲回交，子代均表现雄性不育，进一步证实了这一点。由于细胞质遗传通常表现为母系遗传，因此可以推测控制雄性不育的基因（A）位于细胞质。\n",
        "\n",
        "(2) 将丙与乙杂交，F1均表现雄性可育，说明丙的细胞核基因R的表达产物能够抑制基因A的表达。在基因表达过程中，mRNA作为模板翻译产生多肽链的细胞器是核糖体。\n",
        "\n",
        "F1自交子代中，由于F1是杂合子（RrAa），其自交后代的基因型比例为1RR:2Rr:1rr，1AA:2Aa:1aa。由于雄性不育性状由基因A控制，只有aa基因型表现为雄性不育。因此，雄性可育株（RR、Rr、AA、Aa）与雄性不育株（aa）的数量比为9:1。\n",
        "\n",
        "(3) 以丙为父本与甲杂交（正交）得F1，F1自交得F2。由于甲是纯合子（AA），丙是纯合子（RR），F1的基因型为RrAa。F1自交后，F2的基因型比例为1RR:2Rr:1rr，1AA:2Aa:1aa。与育性有关的表现型有雄性可育（RR、Rr、AA、Aa）和雄性不育（rraa），共2种。\n",
        "\n",
        "反交结果与正交结果不同，反交的F2中与育性有关的基因型有RRAA、RRAa、RrAA、RrAa、rrAA、rrAa、rraa，共7种。\n",
        "\n",
        "--------\n",
        "## 题目编号：8（含图片）\n",
        "## 题目标答\n",
        "(1)(2)(3) (4) (5)\n",
        "## GLM4 9B 模型输出\n",
        "\n",
        "（1）显微镜直接计数法可以观察到细菌的个体，而菌落计数法只能计数活菌形成的菌落。由于死菌不能形成菌落，所以显微镜直接计数法测得的细菌数量大于菌落计数法。\n",
        "\n",
        "（2）根据稀释涂布平板法计算菌液浓度的公式，细菌原液中的细菌浓度 = （平板上菌落数 × 稀释倍数）/ 稀释菌液体积。根据题目，平板上菌落数为100，稀释倍数为10^-1 × 10^-2 = 10^-3，稀释菌液体积为200 μL = 0.2 mL。将这些值代入公式，得到细菌原液中的细菌浓度 = (100 × 10^-3) / 0.2 = 5000个/mL。\n",
        "\n",
        "（3）涂布器在酒精灯上灼烧的目的是为了灭菌，防止杂菌污染。冷却的目的是为了防止高温杀死菌种。\n",
        "\n",
        "（4）根据图可知，杀菌效果最好的消毒液是C。判断依据是：C消毒液处理后，活菌数量最少；C消毒液处理后，活菌的存活率最低。\n",
        "\n",
        "（5）鉴别培养基可用于反映消毒液杀灭大肠杆菌的效果。大肠杆菌在伊红美蓝培养基上生长的菌落呈黑色。\n",
        "\n",
        "--------\n",
        "## 题目编号：9（含图片）\n",
        "## 题目标答\n",
        "(1) 不相等 温度a和c时的呼吸速率不相等(2)温度d时，叶片的光合速率与呼吸速率相等，但植物的根部等细胞不进行光合作用，仍呼吸消耗有机物，导致植物体的干重减少(3)温度过高，导致部分气孔关闭，CO<sub>2</sub>供应不足，暗反应速率降低；温度过高，导致酶的活性降低，使暗反应速率降低(4)光合速率和呼吸速率差值\n",
        "## GLM4 9B 模型输出\n",
        "\n",
        "(1) 该植物叶片在温度a和c时的光合速率相等，叶片有机物积累速率不相等。原因是虽然光合速率相等，但呼吸速率在温度a时大于温度c时的呼吸速率，因此温度a时的有机物积累速率小于温度c时的有机物积累速率。\n",
        "\n",
        "(2) 在温度d时，该植物体的干重会减少，原因是温度d时，植物体的呼吸速率大于光合速率，导致有机物消耗大于有机物积累，从而使植物体的干重减少。\n",
        "\n",
        "(3) 温度超过b时，该植物由于暗反应速率降低导致光合速率降低。暗反应速率降低的原因可能是温度过高导致酶活性降低。\n",
        "\n",
        "(4) 通常情况下，为了最大程度地获得光合产物，农作物在温室栽培过程中，白天温室的温度应控制在光合速率最大时的温度。根据图示，光合速率最大时的温度为b。\n",
        "\n",
        "--------\n",
        "## 题目编号：10\n",
        "## 题目标答\n",
        "(1)体液免疫(2)肽键(3)实验思路：以蛋白质A的片段为抗原，制备单克隆抗体，利用差速离心法将吞噬细胞中的溶酶体分离，并提取溶酶体中的蛋白质，利用抗原抗体杂交技术进行检测预期结果：出现杂交带，表明蛋白质A的片段可出现在吞噬细胞的溶酶体中\n",
        "## GLM4 9B 模型输出\n",
        "\n",
        "(1) 病原体感染诱导产生浆细胞的特异性免疫方式属于体液免疫。\n",
        "\n",
        "(2) 溶酶体中的蛋白酶可将蛋白质A的一条肽链水解成多个片段，蛋白酶切断的化学键是肽键。\n",
        "\n",
        "(3) 实验思路：首先，取吞噬细胞，用特定方法处理使其溶酶体膜破裂，释放溶酶体内容物。然后，将蛋白质A的片段与已知标记的蛋白质片段混合，观察是否出现标记的蛋白质片段。预期结果：如果蛋白质A的片段出现在吞噬细胞的溶酶体中，那么在混合物中应该能够检测到标记的蛋白质片段。\n",
        "\n",
        "--------\n",
        "## 题目编号：11\n",
        "## 题目标答\n",
        "(1)在原地对被保护的生态系统或物种建立自然保护区以及国家公园等(2)天敌、竞争者、食物等(3)存在环境阻力(4)增加生物多样性\n",
        "## GLM4 9B 模型输出\n",
        "\n",
        "(1) 就地保护是保护鸟类B的自然栖息地，避免其栖息地被破坏。\n",
        "\n",
        "(2) 放飞前需考虑的野外生物因素有食物和天敌。\n",
        "\n",
        "(3) 鸟类B的野生种群呈“S”型增长的主要原因是环境阻力。\n",
        "\n",
        "(4) 保护鸟类B等濒危物种的意义是保护生物多样性，维护生态平衡。\n",
        "\n",
        "--------\n",
        "## 题目编号：12（含图片）\n",
        "## 题目标答\n",
        "(1) 变性 氢键(2) 避免目的基因和质粒的任意连接、防止目的基因和质粒的自身环化 T<sub>4</sub>DNA连接酶(3) 细胞处于一种能吸收周围环境中DNA分子的生理状态 利用DNA分子杂交技术，将大肠杆菌的基因组DNA提取出来，在含有目的基因的DNA片段上用放射性同位素等作标记，以此作为探针，使探针与基因组DNA杂交，如果显示出杂交带，表明大肠杆菌中含有重组质粒(4)甘氨酸-脯氨酸-丝氨酸\n",
        "## GLM4 9B 模型输出\n",
        "\n",
        "(1) PCR的每次循环包括变性、复性、延伸3个阶段，其中DNA双链打开成为单链的阶段是变性阶段，引物与模板DNA链碱基之间的化学键是氢键。\n",
        "\n",
        "(2) 与用酶a单酶切相比，用酶a和酶b双酶切的优点体现在：\n",
        "   - 可以产生不同的粘性末端，有利于连接不同的DNA片段；\n",
        "   - 可以提高重组质粒的纯度，减少非特异性连接。\n",
        "\n",
        "   使用酶c单酶切构建重组质粒时宜选用的连接酶是T4 DNA连接酶。\n",
        "\n",
        "(3) 感受态细胞的特点是细胞膜对DNA的通透性增加。\n",
        "\n",
        "   若要验证转化的大肠杆菌中含有重组质粒，简要的实验思路和预期结果是：\n",
        "   - 从转化的大肠杆菌中提取DNA；\n",
        "   - 用限制酶c进行酶切；\n",
        "   - 进行琼脂糖凝胶电泳；\n",
        "   - 如果出现与质粒大小相匹配的条带，则说明转化的大肠杆菌中含有重组质粒。\n",
        "\n",
        "(4) 蛋白E基因中的一段DNA编码序列（与模板链互补）是GGGCCCAAGCTGAGATGA，编码从GGG开始，部分密码子见表。若第一个核苷酸G缺失，则突变后相应肽链的序列是：\n",
        "\n",
        "   - 缺失G后，编码序列变为GCCCAAGCTGAGATGA；\n",
        "   - 根据密码子表，GCC编码丝氨酸（Ser），CAAG编码赖氨酸（Lys），CTG编码丝氨酸（Ser），AGA编码精氨酸（Arg），TGA是终止密码子；\n",
        "   - 因此，突变后相应肽链的序列是Ser-Lys-Ser-Arg。\n"
      ]
    },
    {
      "cell_type": "code",
      "execution_count": 1,
      "metadata": {},
      "outputs": [
        {
          "name": "stderr",
          "output_type": "stream",
          "text": [
            "Special tokens have been added in the vocabulary, make sure the associated word embeddings are fine-tuned or trained.\n"
          ]
        },
        {
          "data": {
            "application/vnd.jupyter.widget-view+json": {
              "model_id": "a73f2ee91757484aa8bf2c500eb62ef6",
              "version_major": 2,
              "version_minor": 0
            },
            "text/plain": [
              "Loading checkpoint shards:   0%|          | 0/10 [00:00<?, ?it/s]"
            ]
          },
          "metadata": {},
          "output_type": "display_data"
        }
      ],
      "source": [
        "import re\n",
        "import json\n",
        "\n",
        "import torch\n",
        "from transformers import AutoTokenizer, AutoModelForCausalLM\n",
        "\n",
        "device = torch.device(\"cuda\")\n",
        "\n",
        "model_path = \"THUDM/glm-4-9b-chat\"\n",
        "gen_kwargs = {\"max_length\": 2048, \"do_sample\": False}\n",
        "\n",
        "tokenizer = AutoTokenizer.from_pretrained(\n",
        "    model_path, trust_remote_code=True,\n",
        ")\n",
        "model = AutoModelForCausalLM.from_pretrained(\n",
        "    model_path,\n",
        "    trust_remote_code=True,\n",
        "    torch_dtype=torch.float16,\n",
        ").eval().to(device)\n"
      ]
    },
    {
      "cell_type": "code",
      "execution_count": 2,
      "metadata": {},
      "outputs": [
        {
          "name": "stdout",
          "output_type": "stream",
          "text": [
            "试卷名：全国甲卷 高考真题 【生物】学科\n",
            "***********************************\n",
            "题目编号：1\n",
            "题目标答：C\n",
            "GLM4 9B 模型输出：\n",
            "首先分析选项A，病毒没有细胞结构，所以A错误。\n",
            "\n",
            "接着分析选项B，原核生物虽然没有线粒体，但部分原核生物含有有氧呼吸酶，也能进行有氧呼吸，所以B错误。\n",
            "\n",
            "然后分析选项C，哺乳动物同一个体中细胞的染色体数目有可能不同，如精子和卵细胞中染色体数目是体细胞的一半，所以C正确。\n",
            "\n",
            "最后分析选项D，小麦根细胞吸收离子消耗的ATP主要由线粒体产生，所以D错误。\n",
            "\n",
            "综上所述，正确答案是C。\n",
            "***************\n",
            "题目编号：2\n",
            "题目标答：B\n",
            "GLM4 9B 模型输出：\n",
            "首先分析各个选项：\n",
            "\n",
            "A. 赤霉素可以诱导某些酶的合成促进种子萌发，这是正确的，因为赤霉素可以解除种子休眠，促进种子萌发。\n",
            "\n",
            "B. 单侧光下生长素的极性运输不需要载体蛋白，这是错误的。生长素的极性运输是主动运输，需要载体蛋白。\n",
            "\n",
            "C. 植物激素可与特异性受体结合调节基因表达，这是正确的。植物激素通过与细胞膜上的受体结合，将外界信号转化为细胞内信号，进而调节基因表达。\n",
            "\n",
            "D. 一种激素可通过诱导其他激素的合成发挥作用，这是正确的。例如，生长素可以诱导乙烯的合成。\n",
            "\n",
            "综上所述，错误的选项是B。\n",
            "\n",
            "答案：B。\n",
            "***************\n",
            "题目编号：3\n",
            "题目标答：D\n",
            "GLM4 9B 模型输出：\n",
            "首先分析选项A，甲状腺激素受体分布于人体内几乎所有细胞，这是正确的。\n",
            "\n",
            "接着分析选项B，甲状腺激素可以提高机体神经系统的兴奋性，这也是正确的。\n",
            "\n",
            "再分析选项C，甲状腺激素分泌增加可使细胞代谢速率加快，这同样是正确的。\n",
            "\n",
            "最后分析选项D，甲状腺激素分泌不足会使血中TSH含量减少。这个选项是错误的，因为甲状腺激素分泌不足时，垂体会分泌更多的TSH来促进甲状腺激素的分泌，所以血中TSH含量会增加。\n",
            "\n",
            "综上所述，错误的选项是D。\n",
            "\n",
            "答案：D。\n",
            "***************\n",
            "题目编号：4（含图片）\n",
            "题目标答：B\n",
            "GLM4 9B 模型输出：\n",
            "根据题目描述，我们可以分析如下：\n",
            "\n",
            "A. 甲数量的变化不会对丙数量产生影响\n",
            "这个选项是错误的。因为甲和丙之间存在数量变化关系，甲数量的变化很可能会对丙数量产生影响。\n",
            "\n",
            "B. 乙在该生态系统中既是捕食者又是被捕食者\n",
            "这个选项是正确的。因为乙既是甲的捕食者，也是丙的捕食者，所以乙既是捕食者又是被捕食者。\n",
            "\n",
            "C. 丙可能是初级消费者，也可能是次级消费者\n",
            "这个选项是错误的。因为丙是乙的捕食者，所以丙至少是次级消费者，不可能是初级消费者。\n",
            "\n",
            "D. 能量流动方向可能是甲→乙→丙，也可能是丙→乙→甲\n",
            "这个选项是错误的。能量流动的方向是从生产者到消费者，再到分解者，所以能量流动方向不可能是甲→乙→丙，也不可能是丙→乙→甲。\n",
            "\n",
            "综上所述，正确答案是B。\n",
            "***************\n",
            "题目编号：5\n",
            "题目标答：A\n",
            "GLM4 9B 模型输出：\n",
            "首先，我们需要了解题目中提到的遗传规律。题目提到果蝇的翅型、体色和眼色性状由独立遗传的等位基因控制，其中弯翅、黄体和紫眼均为隐性性状。这意味着：\n",
            "\n",
            "- 翅型：弯翅（隐性）对直翅（显性）\n",
            "- 体色：黄体（隐性）对灰体（显性）\n",
            "- 眼色：紫眼（隐性）对红眼（显性）\n",
            "\n",
            "另外，控制灰体和黄体性状的基因位于X染色体上，这意味着这些性状的遗传与性别有关。\n",
            "\n",
            "现在我们来分析每个选项：\n",
            "\n",
            "A. 直翅黄体♀×弯翅灰体♂\n",
            "- 翅型：直翅♀（显性）×弯翅♂（隐性）→ F1代全为直翅\n",
            "- 体色：黄体♀（隐性）×灰体♂（显性）→ F1代全为灰体\n",
            "- 眼色：红眼♀（显性）×红眼♂（显性）→ F1代全为红眼\n",
            "- F2代：直翅灰体♀×直翅灰体♂，性状分离比为9∶3∶3∶1\n",
            "\n",
            "B. 直翅灰体♀×弯翅黄体♂\n",
            "- 翅型：直翅♀（显性）×弯翅♂（隐性）→ F1代全为直翅\n",
            "- 体色：灰体♀（显性）×黄体♂（隐性）→ F1代全为灰体\n",
            "- 眼色：红眼♀（显性）×红眼♂（显性）→ F1代全为红眼\n",
            "- F2代：直翅灰体♀×直翅灰体♂，性状分离比为9∶3∶3∶1\n",
            "\n",
            "C. 弯翅红眼♀×直翅紫眼♂\n",
            "- 翅型：弯翅♀（隐性）×直翅♂（显性）→ F1代全为直翅\n",
            "- 体色：红眼♀（显性）×紫眼♂（隐性）→ F1代全为红眼\n",
            "- 眼色：红眼♀（显性）×紫眼♂（隐性）→ F1代全为红眼\n",
            "- F2代：直翅红眼♀×直翅红眼♂，性状分离比为9∶3∶3∶1\n",
            "\n",
            "D. 灰体紫眼♀×黄体红眼♂\n",
            "- 翅型：灰体♀（显性）×黄体♂（隐性）→ F1代全为灰体\n",
            "- 体色：红眼♀（显性）×紫眼♂（隐性）→ F1代全为红眼\n",
            "- 眼色：红眼♀（显性）×紫眼♂（隐性）→ F1代全为红眼\n",
            "- F2代：灰体红眼♀×灰体红眼♂，性状分离比不符合9∶3∶3∶1，因为体色只有灰体一种表现型\n",
            "\n",
            "因此，F2的性状分离比不符合9∶3∶3∶1的亲本组合是D. 灰体紫眼♀×黄体红眼♂。\n",
            "***************\n",
            "题目编号：6（含图片）\n",
            "题目标答：暂无\n",
            "GLM4 9B 模型输出：\n",
            "首先，我们来分析每个选项的正确性。\n",
            "\n",
            "A选项：ATP转化为ADP可为离子的主动运输提供能量。这是正确的，因为主动运输需要消耗能量，而ATP的水解可以提供这种能量。\n",
            "\n",
            "B选项：用α位<sup>32</sup>P标记的ATP可以合成带有<sup>32</sup>P的RNA。这也是正确的，因为ATP在细胞内可以参与RNA的合成过程，如果ATP的α位被标记，那么在RNA合成过程中，这些标记的磷酸基团可能会被转移到RNA分子上。\n",
            "\n",
            "C选项：β和γ位磷酸基团之间的高能磷酸键不能在细胞核中断裂。这是错误的，因为β和γ位磷酸基团之间的高能磷酸键可以在细胞核中断裂，例如在DNA复制和转录过程中，ATP可以提供能量。\n",
            "\n",
            "D选项：光合作用可将光能转化为化学能储存于β和γ位磷酸基团之间的高能磷酸键。这是正确的，光合作用确实可以将光能转化为化学能，并储存在ATP的高能磷酸键中。\n",
            "\n",
            "综上所述，错误的叙述是C选项。\n",
            "***************\n",
            "题目编号：7\n",
            "题目标答：(1)(2) (3)\n",
            "GLM4 9B 模型输出：\n",
            "(1) 根据题目描述，用性状优良的水稻纯合体（甲）给某雄性不育水稻植株授粉，杂交子一代均表现雄性不育，说明雄性不育性状是由母本（甲）传递给子代的。杂交子一代与甲回交，子代均表现雄性不育，进一步证实了这一点。由于细胞质遗传通常表现为母系遗传，因此可以推测控制雄性不育的基因（A）位于细胞质。\n",
            "\n",
            "(2) 将丙与乙杂交，F1均表现雄性可育，说明丙的细胞核基因R的表达产物能够抑制基因A的表达。在基因表达过程中，mRNA作为模板翻译产生多肽链的细胞器是核糖体。\n",
            "\n",
            "F1自交子代中，由于F1是杂合子（RrAa），其自交后代的基因型比例为1RR:2Rr:1rr，1AA:2Aa:1aa。由于雄性不育性状由基因A控制，只有aa基因型表现为雄性不育。因此，雄性可育株（RR、Rr、AA、Aa）与雄性不育株（aa）的数量比为9:1。\n",
            "\n",
            "(3) 以丙为父本与甲杂交（正交）得F1，F1自交得F2。由于甲是纯合子（AA），丙是纯合子（RR），F1的基因型为RrAa。F1自交后，F2的基因型比例为1RR:2Rr:1rr，1AA:2Aa:1aa。与育性有关的表现型有雄性可育（RR、Rr、AA、Aa）和雄性不育（rraa），共2种。\n",
            "\n",
            "反交结果与正交结果不同，反交的F2中与育性有关的基因型有RRAA、RRAa、RrAA、RrAa、rrAA、rrAa、rraa，共7种。\n",
            "***************\n",
            "题目编号：8（含图片）\n",
            "题目标答：(1)(2)(3) (4) (5)\n",
            "GLM4 9B 模型输出：\n",
            "（1）显微镜直接计数法可以观察到细菌的个体，而菌落计数法只能计数活菌形成的菌落。由于死菌不能形成菌落，所以显微镜直接计数法测得的细菌数量大于菌落计数法。\n",
            "\n",
            "（2）根据稀释涂布平板法计算菌液浓度的公式，细菌原液中的细菌浓度 = （平板上菌落数 × 稀释倍数）/ 稀释菌液体积。根据题目，平板上菌落数为100，稀释倍数为10^-1 × 10^-2 = 10^-3，稀释菌液体积为200 μL = 0.2 mL。将这些值代入公式，得到细菌原液中的细菌浓度 = (100 × 10^-3) / 0.2 = 5000个/mL。\n",
            "\n",
            "（3）涂布器在酒精灯上灼烧的目的是为了灭菌，防止杂菌污染。冷却的目的是为了防止高温杀死菌种。\n",
            "\n",
            "（4）根据图可知，杀菌效果最好的消毒液是C。判断依据是：C消毒液处理后，活菌数量最少；C消毒液处理后，活菌的存活率最低。\n",
            "\n",
            "（5）鉴别培养基可用于反映消毒液杀灭大肠杆菌的效果。大肠杆菌在伊红美蓝培养基上生长的菌落呈黑色。\n",
            "***************\n",
            "题目编号：9（含图片）\n",
            "题目标答：(1) 不相等 温度a和c时的呼吸速率不相等(2)温度d时，叶片的光合速率与呼吸速率相等，但植物的根部等细胞不进行光合作用，仍呼吸消耗有机物，导致植物体的干重减少(3)温度过高，导致部分气孔关闭，CO<sub>2</sub>供应不足，暗反应速率降低；温度过高，导致酶的活性降低，使暗反应速率降低(4)光合速率和呼吸速率差值\n",
            "GLM4 9B 模型输出：\n",
            "(1) 该植物叶片在温度a和c时的光合速率相等，叶片有机物积累速率不相等。原因是虽然光合速率相等，但呼吸速率在温度a时大于温度c时的呼吸速率，因此温度a时的有机物积累速率小于温度c时的有机物积累速率。\n",
            "\n",
            "(2) 在温度d时，该植物体的干重会减少，原因是温度d时，植物体的呼吸速率大于光合速率，导致有机物消耗大于有机物积累，从而使植物体的干重减少。\n",
            "\n",
            "(3) 温度超过b时，该植物由于暗反应速率降低导致光合速率降低。暗反应速率降低的原因可能是温度过高导致酶活性降低。\n",
            "\n",
            "(4) 通常情况下，为了最大程度地获得光合产物，农作物在温室栽培过程中，白天温室的温度应控制在光合速率最大时的温度。根据图示，光合速率最大时的温度为b。\n",
            "***************\n",
            "题目编号：10\n",
            "题目标答：(1)体液免疫(2)肽键(3)实验思路：以蛋白质A的片段为抗原，制备单克隆抗体，利用差速离心法将吞噬细胞中的溶酶体分离，并提取溶酶体中的蛋白质，利用抗原抗体杂交技术进行检测预期结果：出现杂交带，表明蛋白质A的片段可出现在吞噬细胞的溶酶体中\n",
            "GLM4 9B 模型输出：\n",
            "(1) 病原体感染诱导产生浆细胞的特异性免疫方式属于体液免疫。\n",
            "\n",
            "(2) 溶酶体中的蛋白酶可将蛋白质A的一条肽链水解成多个片段，蛋白酶切断的化学键是肽键。\n",
            "\n",
            "(3) 实验思路：首先，取吞噬细胞，用特定方法处理使其溶酶体膜破裂，释放溶酶体内容物。然后，将蛋白质A的片段与已知标记的蛋白质片段混合，观察是否出现标记的蛋白质片段。预期结果：如果蛋白质A的片段出现在吞噬细胞的溶酶体中，那么在混合物中应该能够检测到标记的蛋白质片段。\n",
            "***************\n",
            "题目编号：11\n",
            "题目标答：(1)在原地对被保护的生态系统或物种建立自然保护区以及国家公园等(2)天敌、竞争者、食物等(3)存在环境阻力(4)增加生物多样性\n",
            "GLM4 9B 模型输出：\n",
            "(1) 就地保护是保护鸟类B的自然栖息地，避免其栖息地被破坏。\n",
            "\n",
            "(2) 放飞前需考虑的野外生物因素有食物和天敌。\n",
            "\n",
            "(3) 鸟类B的野生种群呈“S”型增长的主要原因是环境阻力。\n",
            "\n",
            "(4) 保护鸟类B等濒危物种的意义是保护生物多样性，维护生态平衡。\n",
            "***************\n",
            "题目编号：12（含图片）\n",
            "题目标答：(1) 变性 氢键(2) 避免目的基因和质粒的任意连接、防止目的基因和质粒的自身环化 T<sub>4</sub>DNA连接酶(3) 细胞处于一种能吸收周围环境中DNA分子的生理状态 利用DNA分子杂交技术，将大肠杆菌的基因组DNA提取出来，在含有目的基因的DNA片段上用放射性同位素等作标记，以此作为探针，使探针与基因组DNA杂交，如果显示出杂交带，表明大肠杆菌中含有重组质粒(4)甘氨酸-脯氨酸-丝氨酸\n",
            "GLM4 9B 模型输出：\n",
            "(1) PCR的每次循环包括变性、复性、延伸3个阶段，其中DNA双链打开成为单链的阶段是变性阶段，引物与模板DNA链碱基之间的化学键是氢键。\n",
            "\n",
            "(2) 与用酶a单酶切相比，用酶a和酶b双酶切的优点体现在：\n",
            "   - 可以产生不同的粘性末端，有利于连接不同的DNA片段；\n",
            "   - 可以提高重组质粒的纯度，减少非特异性连接。\n",
            "\n",
            "   使用酶c单酶切构建重组质粒时宜选用的连接酶是T4 DNA连接酶。\n",
            "\n",
            "(3) 感受态细胞的特点是细胞膜对DNA的通透性增加。\n",
            "\n",
            "   若要验证转化的大肠杆菌中含有重组质粒，简要的实验思路和预期结果是：\n",
            "   - 从转化的大肠杆菌中提取DNA；\n",
            "   - 用限制酶c进行酶切；\n",
            "   - 进行琼脂糖凝胶电泳；\n",
            "   - 如果出现与质粒大小相匹配的条带，则说明转化的大肠杆菌中含有重组质粒。\n",
            "\n",
            "(4) 蛋白E基因中的一段DNA编码序列（与模板链互补）是GGGCCCAAGCTGAGATGA，编码从GGG开始，部分密码子见表。若第一个核苷酸G缺失，则突变后相应肽链的序列是：\n",
            "\n",
            "   - 缺失G后，编码序列变为GCCCAAGCTGAGATGA；\n",
            "   - 根据密码子表，GCC编码丝氨酸（Ser），CAAG编码赖氨酸（Lys），CTG编码丝氨酸（Ser），AGA编码精氨酸（Arg），TGA是终止密码子；\n",
            "   - 因此，突变后相应肽链的序列是Ser-Lys-Ser-Arg。\n"
          ]
        }
      ],
      "source": [
        "subject, paper_type = \"生物\", \"全国甲卷\"\n",
        "file_name = f\"../data/{paper_type}/{subject}.jsonl\"\n",
        "\n",
        "questions = []\n",
        "\n",
        "print(f\"试卷名：{paper_type} 高考真题 【{subject}】学科\")\n",
        "\n",
        "with open(file_name, \"r\") as f:\n",
        "    for i, line in enumerate(f):\n",
        "        data = json.loads(line)\n",
        "        has_img, question = False, data['prompt']\n",
        "\n",
        "        if '<img' in question:\n",
        "            has_img = True\n",
        "            question = re.sub(r'<img[^>]*?/>', \"\", question)\n",
        "\n",
        "        inputs = tokenizer.apply_chat_template(\n",
        "            [{\"role\": \"user\", \"content\": question}],\n",
        "            add_generation_prompt=True,\n",
        "            tokenize=True,\n",
        "            return_tensors=\"pt\",\n",
        "            return_dict=True\n",
        "        )\n",
        "        inputs = inputs.to(device)\n",
        "\n",
        "        with torch.no_grad():\n",
        "            outputs = model.generate(**inputs, **gen_kwargs)\n",
        "            outputs = outputs[:, inputs['input_ids'].shape[1]:]\n",
        "            \n",
        "            response = tokenizer.decode(outputs[0], skip_special_tokens=True)\n",
        "\n",
        "        if i == 0:\n",
        "            print(\"*\" * 35)\n",
        "        else:\n",
        "            print(\"*\" * 15)\n",
        "\n",
        "        print(\"题目编号：\" + str(i+1) + (\"（含图片）\" if has_img else \"\"))\n",
        "        print(\"题目标答：\" + data[\"answer\"])\n",
        "        print(\"GLM4 9B 模型输出：\" + response)\n",
        "            \n",
        "        questions.append({\n",
        "            \"id\": str(i+1),\n",
        "            \"question\": question,\n",
        "            \"answer\": data[\"answer\"],\n",
        "            \"output\": response,\n",
        "            \"has_img\": has_img\n",
        "        })"
      ]
    }
  ],
  "metadata": {
    "kernelspec": {
      "display_name": "base",
      "language": "python",
      "name": "python3"
    },
    "language_info": {
      "codemirror_mode": {
        "name": "ipython",
        "version": 3
      },
      "file_extension": ".py",
      "mimetype": "text/x-python",
      "name": "python",
      "nbconvert_exporter": "python",
      "pygments_lexer": "ipython3",
      "version": "3.10.12"
    }
  },
  "nbformat": 4,
  "nbformat_minor": 2
}