{
  "cells": [
    {
      "cell_type": "markdown",
      "metadata": {},
      "source": [
        "# 试卷名：全国甲卷 高考真题 【生物】学科\n",
        "\n",
        "## 题目编号：1\n",
        "## 题目标答\n",
        "C\n",
        "## Yi 34B 模型输出\n",
        "C\n",
        "\n",
        "解析：\n",
        "\n",
        "A.病毒没有细胞结构，A错误；\n",
        "\n",
        "B.原核生物没有线粒体，但是部分原核生物可以进行有氧呼吸，如硝化细菌、蓝藻等，B错误；\n",
        "\n",
        "C.哺乳动物同一个体中细胞的染色体数目有可能不同，如性染色体组成不同的X和Y染色体，再比如经有丝分裂和减数分裂形成的生殖细胞中染色体数目不同，C正确；\n",
        "\n",
        "D.小麦根细胞吸收离子的场所是细胞质基质和线粒体，所以消耗的ATP由细胞质基质和线粒体产生，D错误。\n",
        "\n",
        "故选C。\n",
        "\n",
        "\n",
        "\n",
        "--------\n",
        "## 题目编号：2\n",
        "## 题目标答\n",
        "B\n",
        "## Yi 34B 模型输出\n",
        "B\n",
        "【分析】\n",
        "本题考查植物激素的作用，要求考生识记植物激素的种类及功能，能结合所学的知识准确答题，属于考纲识记层次的考查。\n",
        "\n",
        "\n",
        "--------\n",
        "## 题目编号：3\n",
        "## 题目标答\n",
        "D\n",
        "## Yi 34B 模型输出\n",
        "【分析】\n",
        "本题考查了甲状腺激素的生理作用，解答本题的关键是掌握甲状腺激素的生理作用。\n",
        "【解答】\n",
        "A.甲状腺激素的受体分布于人体内几乎所有细胞，A正确；\n",
        "B.甲状腺激素可以提高机体神经系统的兴奋性，B正确；\n",
        "C.甲状腺激素分泌增加可使细胞代谢速率加快，C正确；\n",
        "D.甲状腺激素分泌不足会使血中TSH含量增加，D错误。\n",
        "故选D。\n",
        "\n",
        "\n",
        "--------\n",
        "## 题目编号：4（含图片）\n",
        "## 题目标答\n",
        "B\n",
        "## Yi 34B 模型输出\n",
        "B\n",
        "\n",
        "B\n",
        "\n",
        "B\n",
        "\n",
        "B\n",
        "\n",
        "--------\n",
        "## 题目编号：5\n",
        "## 题目标答\n",
        "A\n",
        "## Yi 34B 模型输出\n",
        "B\n",
        "【分析】\n",
        "本题考查自由组合定律和伴性遗传的相关知识，意在考查学生的理解和判断能力。\n",
        "\n",
        "\n",
        "--------\n",
        "## 题目编号：6（含图片）\n",
        "## 题目标答\n",
        "暂无\n",
        "## Yi 34B 模型输出\n",
        "【分析】\n",
        "本题考查ATP的相关知识，意在考查学生的识记能力和判断能力，运用所学知识综合分析问题的能力是解答本题的关键。\n",
        "<span>【解答】</span>\n",
        "<span>A.ATP水解时远离A的高能磷酸键断裂，为生命活动提供能量，A正确；</span>\n",
        "<span>B.α位是腺苷，由腺嘌呤和核糖组成，不含P，α位</span><sup>32</sup><span>P标记的ATP水解时，可产生带有</span><sup>32</sup><span>P的RNA，B正确；</span>\n",
        "<span>C.β和γ位磷酸基团之间的高能磷酸键断裂时释放的能量较少，C错误；</span>\n",
        "<span>D.光合作用的光反应阶段可将光能转化为化学能，储存在ATP中，D正确。</span>\n",
        "<span>故选C。</span>\n",
        "\n",
        "\n",
        "--------\n",
        "## 题目编号：7\n",
        "## 题目标答\n",
        "(1)(2) (3)\n",
        "## Yi 34B 模型输出\n",
        "【分析】\n",
        "本题考查了基因的表达和基因分离定律的应用，准确理解相关知识点是解题的关键。\n",
        "<|im_end|> \n",
        "<|im_start|>分析：\n",
        "(1)根据题意可知，甲植株为优良品种，且甲植株为纯合子，乙植株为雄性不育品系，则乙植株为杂合子，连续自交两代，子代均不发生性状分离，说明控制雄性不育的基因位于细胞质中；\n",
        "(2)由于基因R的表达产物能够抑制基因A的表达，因此基因R的表达产物与基因A的表达产物互为抑制关系；基因R的表达产物为蛋白质，蛋白质的合成场所是核糖体；由于乙植株为杂合子，因此F<sub>1</sub>自交子代中雄性可育株与雄性不育株的数量比为1：1；\n",
        "(3)根据题意可知，甲植株为优良品种，且甲植株为纯合子，乙植株为雄性不育品系，则乙植株为杂合子，因此甲植株的基因型为aa，乙植株的基因型为Aa，丙植株为优良品种，且丙植株为纯合子，因此丙植株的基因型为RR，乙植株的基因型为aaRr。\n",
        "<|im_end|>\n",
        "(1)细胞质\n",
        "(2)核糖体 1：1\n",
        "(3)4 aaRR、aaRr、AaRr、AARR、AArr、AaRR、AaRr、aaRr\n",
        "【分析】\n",
        "<|im_start|>分析：\n",
        "(1)根据题意可知，甲植株为优良品种，且甲植株为纯合子，乙植株为雄性不育品系，则乙植株为杂合子，连续自交两代，子代均不发生性状分离，说明控制雄性不育的基因位于细胞质中；\n",
        "(2)由于基因R的表达产物能够抑制基因A的表达，因此基因R的表达产物与基因A的表达产物互为抑制关系；基因R的表达产物为蛋白质，蛋白质的合成场所是核糖体；由于乙植株为杂合子，因此F<sub>1</sub>自交子代中雄性可育株与雄性不育株的数量比为1：1；\n",
        "(3)根据题意可知，甲植株为优良品种，且甲植株为纯合子，乙植株为雄性不育品系，则乙植株为杂合子，因此甲植株的基因型为aa，乙植株的基因型为Aa，丙植株为优良品种，且丙植株为纯合子，因此丙植株的基因型为RR，乙植株的基因型为aaRr。\n",
        "<|im_end|>\n",
        "(1)根据题意可知，甲植株为优良品种，且甲植株为纯合子，乙植株为雄性不育品系，则乙植株为杂合子，连续自交两代，子代均不发生性状分离，说明控制雄性不育的基因位于细胞质中；\n",
        "(2)由于基因R的表达产物能够抑制基因A的表达，因此基因R的表达产物与基因A的表达产物互为抑制关系；基因R的表达产物为蛋白质，蛋白质的合成场所是核糖体；由于乙植株为杂合子，因此F<sub>1</sub>自交子代中雄性可育株与雄性不育株的数量比为1：1；\n",
        "(3)根据题意可知，甲植株为优良品种，且甲植株为纯合子，乙植株为雄性不育品系，则乙植株为杂合子，因此甲植株的基因型为aa，乙植株的基因型为Aa，丙植株为优良品种，且丙植株为纯合子，因此丙植株的基因型为RR，乙植株的基因型为aaRr。\n",
        "\n",
        "\n",
        "--------\n",
        "## 题目编号：8（含图片）\n",
        "## 题目标答\n",
        "(1)(2)(3) (4) (5)\n",
        "## Yi 34B 模型输出\n",
        "(1) 使用显微镜直接计数法（也称为活体计数法）时，计数的是所有细菌细胞，包括活菌和死菌，以及一些不能形成菌落的细菌细胞（如处于休眠状态的细菌）。而菌落计数法（也称为稀释涂布平板法）只能计数那些能够形成可见菌落的单个活细菌细胞。因此，显微镜直接计数法得到的细菌数量通常会大于菌落计数法的结果，原因是在显微镜下计数的细菌包括了不能形成菌落的细菌细胞和死菌细胞。\n",
        "\n",
        "(2) 该同学从100 mL细菌原液中取1 mL加入无菌水得到10 mL稀释菌液，这意味着原液被稀释了100倍。从稀释菌液中取200 μL涂布平板，菌落计数的结果为100。由于200 μL只占稀释后的10 mL中的很小一部分，我们可以假设这200 μL中的细菌数量代表了整个10 mL稀释菌液中的细菌数量。因此，10 mL稀释菌液中有100个菌落，即每mL中有10个菌落。由于原液被稀释了100倍，所以原液中每mL的细菌菌落数为10 * 100 = 1000个。\n",
        "\n",
        "(3) 菌落计数过程中，涂布器先在酒精灯上灼烧是为了杀死涂布器上的任何微生物，以避免污染培养基和确保计数的准确性。冷却后再涂布是为了防止高温对培养基或细菌细胞造成伤害，确保涂布过程不会因过热而影响细菌的存活和生长。\n",
        "\n",
        "(4) 根据图中所示，消毒液B和C在所有时间点上均能有效减少细菌数量，而消毒液A在较短时间后细菌数量有所回升，表明其杀菌效果不如B和C。因此，杀菌效果最好的消毒液是B和C。判断依据包括：\n",
        "- 消毒液B和C在所有时间点上都能显著减少细菌数量，而A不能。\n",
        "- 消毒液B和C在较长时间后仍然保持较低的细菌数量，而A在较短时间后细菌数量有所回升。\n",
        "\n",
        "(5) 大肠杆菌在伊红美蓝培养基上生长的菌落呈黑色。伊红美蓝培养基是一种用于鉴别大肠杆菌的培养基，它能够使大肠杆菌的菌落呈现出黑色，这是由于大肠杆菌能够发酵乳糖产生大量的醋酸和色素，这些物质与伊红美蓝结合形成黑色沉淀，从而使得菌落呈黑色。\n",
        "\n",
        "--------\n",
        "## 题目编号：9（含图片）\n",
        "## 题目标答\n",
        "(1) 不相等 温度a和c时的呼吸速率不相等(2)温度d时，叶片的光合速率与呼吸速率相等，但植物的根部等细胞不进行光合作用，仍呼吸消耗有机物，导致植物体的干重减少(3)温度过高，导致部分气孔关闭，CO<sub>2</sub>供应不足，暗反应速率降低；温度过高，导致酶的活性降低，使暗反应速率降低(4)光合速率和呼吸速率差值\n",
        "## Yi 34B 模型输出\n",
        "【分析】\n",
        "本题考查光合作用和呼吸作用的相关知识，要求考生识记光合作用和呼吸作用的具体过程，掌握影响光合作用和呼吸作用的环境因素，能结合图中信息准确答题。\n",
        "<span>根据题图分析，温度为a时，植物净光合速率为0，实际光合速率等于呼吸速率；温度为b时，植物呼吸速率达到最大值；温度为c时，植物净光合速率等于呼吸速率。</span>\n",
        "<span>【解答】</span>\n",
        "<span>（1）该植物叶片在温度a和c时的光合速率相等，但叶片有机物积累速率不相等，原因是温度为a时，植物实际光合速率等于呼吸速率，而温度为c时，植物净光合速率等于呼吸速率。</span>\n",
        "<span>（2）在温度d时，该植物体的干重会减少，原因是呼吸速率大于光合速率，有机物被消耗。</span>\n",
        "<span>（3）温度超过b时，该植物由于暗反应速率降低导致光合速率降低。暗反应速率降低的原因可能是温度过高，导致酶的活性降低（或二氧化碳浓度降低）。</span>\n",
        "<span>（4）通常情况下，为了最大程度地获得光合产物，农作物在温室栽培过程中，白天温室的温度应控制在光合速率或净光合速率最大时的温度，即在b点对应的温度。</span>\n",
        "\n",
        "\n",
        "\n",
        "--------\n",
        "## 题目编号：10\n",
        "## 题目标答\n",
        "(1)体液免疫(2)肽键(3)实验思路：以蛋白质A的片段为抗原，制备单克隆抗体，利用差速离心法将吞噬细胞中的溶酶体分离，并提取溶酶体中的蛋白质，利用抗原抗体杂交技术进行检测预期结果：出现杂交带，表明蛋白质A的片段可出现在吞噬细胞的溶酶体中\n",
        "## Yi 34B 模型输出\n",
        "【分析】\n",
        "本题考查人体免疫系统在维持稳态中的作用，要求考生识记人体免疫系统的组成及功能，掌握体液免疫和细胞免疫的具体过程，能结合所学的知识准确答题。\n",
        "\n",
        "\n",
        "--------\n",
        "## 题目编号：11\n",
        "## 题目标答\n",
        "(1)在原地对被保护的生态系统或物种建立自然保护区以及国家公园等(2)天敌、竞争者、食物等(3)存在环境阻力(4)增加生物多样性\n",
        "## Yi 34B 模型输出\n",
        "【分析】\n",
        "本题考查种群和生物多样性的相关知识，要求考生识记种群的概念和特征，明确种群呈“S”型增长的主要原因是受资源和空间限制；识记生物多样性的保护措施，能结合所学的知识准确答题。\n",
        "【解答】\n",
        "（1）保护鸟类B采取“就地保护为主，易地保护为辅”模式。就地保护是建立自然保护区。\n",
        "（2）鸟类B经人工繁育达到一定数量后可放飞野外。为保证鸟类B正常生存繁殖，放飞前需考虑的野外生物因素有食物、天敌等。\n",
        "（3）鸟类B的野生种群稳步增长。通常，种群呈“S”型增长的主要原因是受资源和空间限制。\n",
        "（4）保护鸟类B等濒危物种的意义是保护生物多样性，保护生物多样性利用的意义是在生态、经济、科研和美学等方面。\n",
        "\n",
        "\n",
        "--------\n",
        "## 题目编号：12（含图片）\n",
        "## 题目标答\n",
        "(1) 变性 氢键(2) 避免目的基因和质粒的任意连接、防止目的基因和质粒的自身环化 T<sub>4</sub>DNA连接酶(3) 细胞处于一种能吸收周围环境中DNA分子的生理状态 利用DNA分子杂交技术，将大肠杆菌的基因组DNA提取出来，在含有目的基因的DNA片段上用放射性同位素等作标记，以此作为探针，使探针与基因组DNA杂交，如果显示出杂交带，表明大肠杆菌中含有重组质粒(4)甘氨酸-脯氨酸-丝氨酸\n",
        "## Yi 34B 模型输出\n",
        "(1) 变性阶段\n",
        "氢键\n",
        "(2) 避免酶切片段之间的粘性末端相互连接；T<sub>4</sub> DNA连接酶\n",
        "(3) 细胞膜的通透性增大，能吸收质粒DNA；在培养基中长出 colonies\n",
        "(4) Gly-Ser-Lys\n",
        "\n",
        "(1) 在PCR过程中，变性阶段通过高温使DNA双链打开成为单链。引物与模板DNA链碱基之间通过氢键结合。\n",
        "\n",
        "(2) 使用酶a和酶b双酶切可以避免酶切片段之间的粘性末端相互连接，从而减少自我环化等不需要的连接。由于酶c切割产生的粘性末端有一个缺口，因此需要T<sub>4</sub> DNA连接酶这种具有缺口修复功能的连接酶。\n",
        "\n",
        "(3) 感受态细胞是经过处理的细胞，其细胞膜的通透性增大，能吸收质粒DNA。为了验证转化的大肠杆菌中含有重组质粒，可以将转化后的细胞接种在含抗生素的培养基上，如果细胞能够生长形成 colonies，说明重组质粒已被成功转入。\n",
        "\n",
        "(4) 若第一个核苷酸G缺失，则密码子变为“CCCAAGCTGAGATGA”。根据密码子表，突变后的肽链序列将是 Gly-Ser-Lys（甘氨酸-丝氨酸-赖氨酸）。\n"
      ]
    },
    {
      "cell_type": "code",
      "execution_count": 1,
      "metadata": {},
      "outputs": [
        {
          "data": {
            "application/vnd.jupyter.widget-view+json": {
              "model_id": "0b34fa234f344d48adf6d9868a2e47b6",
              "version_major": 2,
              "version_minor": 0
            },
            "text/plain": [
              "Loading checkpoint shards:   0%|          | 0/15 [00:00<?, ?it/s]"
            ]
          },
          "metadata": {},
          "output_type": "display_data"
        }
      ],
      "source": [
        "import re\n",
        "import json\n",
        "\n",
        "import torch\n",
        "from transformers import AutoTokenizer, AutoModelForCausalLM\n",
        "\n",
        "device = torch.device(\"cuda\")\n",
        "\n",
        "model_path = \"01-ai/Yi-1.5-34B-Chat\"\n",
        "gen_kwargs = {\"max_length\": 2048, \"do_sample\": False}\n",
        "\n",
        "tokenizer = AutoTokenizer.from_pretrained(\n",
        "    model_path, trust_remote_code=True,\n",
        ")\n",
        "model = AutoModelForCausalLM.from_pretrained(\n",
        "    model_path,\n",
        "    trust_remote_code=True,\n",
        "    torch_dtype=torch.float16,\n",
        ").eval().to(device)"
      ]
    },
    {
      "cell_type": "code",
      "execution_count": 2,
      "metadata": {},
      "outputs": [
        {
          "name": "stdout",
          "output_type": "stream",
          "text": [
            "试卷名：全国甲卷 高考真题 【生物】学科\n"
          ]
        },
        {
          "name": "stdout",
          "output_type": "stream",
          "text": [
            "***********************************\n",
            "题目编号：1\n",
            "题目标答：C\n",
            "Yi 34B 模型输出：C\n",
            "\n",
            "解析：\n",
            "\n",
            "A.病毒没有细胞结构，A错误；\n",
            "\n",
            "B.原核生物没有线粒体，但是部分原核生物可以进行有氧呼吸，如硝化细菌、蓝藻等，B错误；\n",
            "\n",
            "C.哺乳动物同一个体中细胞的染色体数目有可能不同，如性染色体组成不同的X和Y染色体，再比如经有丝分裂和减数分裂形成的生殖细胞中染色体数目不同，C正确；\n",
            "\n",
            "D.小麦根细胞吸收离子的场所是细胞质基质和线粒体，所以消耗的ATP由细胞质基质和线粒体产生，D错误。\n",
            "\n",
            "故选C。\n",
            "\n",
            "\n",
            "***************\n",
            "题目编号：2\n",
            "题目标答：B\n",
            "Yi 34B 模型输出：B\n",
            "【分析】\n",
            "本题考查植物激素的作用，要求考生识记植物激素的种类及功能，能结合所学的知识准确答题，属于考纲识记层次的考查。\n",
            "\n",
            "***************\n",
            "题目编号：3\n",
            "题目标答：D\n",
            "Yi 34B 模型输出：【分析】\n",
            "本题考查了甲状腺激素的生理作用，解答本题的关键是掌握甲状腺激素的生理作用。\n",
            "【解答】\n",
            "A.甲状腺激素的受体分布于人体内几乎所有细胞，A正确；\n",
            "B.甲状腺激素可以提高机体神经系统的兴奋性，B正确；\n",
            "C.甲状腺激素分泌增加可使细胞代谢速率加快，C正确；\n",
            "D.甲状腺激素分泌不足会使血中TSH含量增加，D错误。\n",
            "故选D。\n",
            "\n",
            "***************\n",
            "题目编号：4（含图片）\n",
            "题目标答：B\n",
            "Yi 34B 模型输出：B\n",
            "\n",
            "B\n",
            "\n",
            "B\n",
            "\n",
            "B\n",
            "***************\n",
            "题目编号：5\n",
            "题目标答：A\n",
            "Yi 34B 模型输出：B\n",
            "【分析】\n",
            "本题考查自由组合定律和伴性遗传的相关知识，意在考查学生的理解和判断能力。\n",
            "\n",
            "***************\n",
            "题目编号：6（含图片）\n",
            "题目标答：暂无\n",
            "Yi 34B 模型输出：【分析】\n",
            "本题考查ATP的相关知识，意在考查学生的识记能力和判断能力，运用所学知识综合分析问题的能力是解答本题的关键。\n",
            "<span>【解答】</span>\n",
            "<span>A.ATP水解时远离A的高能磷酸键断裂，为生命活动提供能量，A正确；</span>\n",
            "<span>B.α位是腺苷，由腺嘌呤和核糖组成，不含P，α位</span><sup>32</sup><span>P标记的ATP水解时，可产生带有</span><sup>32</sup><span>P的RNA，B正确；</span>\n",
            "<span>C.β和γ位磷酸基团之间的高能磷酸键断裂时释放的能量较少，C错误；</span>\n",
            "<span>D.光合作用的光反应阶段可将光能转化为化学能，储存在ATP中，D正确。</span>\n",
            "<span>故选C。</span>\n",
            "\n",
            "***************\n",
            "题目编号：7\n",
            "题目标答：(1)(2) (3)\n",
            "Yi 34B 模型输出：【分析】\n",
            "本题考查了基因的表达和基因分离定律的应用，准确理解相关知识点是解题的关键。\n",
            "<|im_end|> \n",
            "<|im_start|>分析：\n",
            "(1)根据题意可知，甲植株为优良品种，且甲植株为纯合子，乙植株为雄性不育品系，则乙植株为杂合子，连续自交两代，子代均不发生性状分离，说明控制雄性不育的基因位于细胞质中；\n",
            "(2)由于基因R的表达产物能够抑制基因A的表达，因此基因R的表达产物与基因A的表达产物互为抑制关系；基因R的表达产物为蛋白质，蛋白质的合成场所是核糖体；由于乙植株为杂合子，因此F<sub>1</sub>自交子代中雄性可育株与雄性不育株的数量比为1：1；\n",
            "(3)根据题意可知，甲植株为优良品种，且甲植株为纯合子，乙植株为雄性不育品系，则乙植株为杂合子，因此甲植株的基因型为aa，乙植株的基因型为Aa，丙植株为优良品种，且丙植株为纯合子，因此丙植株的基因型为RR，乙植株的基因型为aaRr。\n",
            "<|im_end|>\n",
            "(1)细胞质\n",
            "(2)核糖体 1：1\n",
            "(3)4 aaRR、aaRr、AaRr、AARR、AArr、AaRR、AaRr、aaRr\n",
            "【分析】\n",
            "<|im_start|>分析：\n",
            "(1)根据题意可知，甲植株为优良品种，且甲植株为纯合子，乙植株为雄性不育品系，则乙植株为杂合子，连续自交两代，子代均不发生性状分离，说明控制雄性不育的基因位于细胞质中；\n",
            "(2)由于基因R的表达产物能够抑制基因A的表达，因此基因R的表达产物与基因A的表达产物互为抑制关系；基因R的表达产物为蛋白质，蛋白质的合成场所是核糖体；由于乙植株为杂合子，因此F<sub>1</sub>自交子代中雄性可育株与雄性不育株的数量比为1：1；\n",
            "(3)根据题意可知，甲植株为优良品种，且甲植株为纯合子，乙植株为雄性不育品系，则乙植株为杂合子，因此甲植株的基因型为aa，乙植株的基因型为Aa，丙植株为优良品种，且丙植株为纯合子，因此丙植株的基因型为RR，乙植株的基因型为aaRr。\n",
            "<|im_end|>\n",
            "(1)根据题意可知，甲植株为优良品种，且甲植株为纯合子，乙植株为雄性不育品系，则乙植株为杂合子，连续自交两代，子代均不发生性状分离，说明控制雄性不育的基因位于细胞质中；\n",
            "(2)由于基因R的表达产物能够抑制基因A的表达，因此基因R的表达产物与基因A的表达产物互为抑制关系；基因R的表达产物为蛋白质，蛋白质的合成场所是核糖体；由于乙植株为杂合子，因此F<sub>1</sub>自交子代中雄性可育株与雄性不育株的数量比为1：1；\n",
            "(3)根据题意可知，甲植株为优良品种，且甲植株为纯合子，乙植株为雄性不育品系，则乙植株为杂合子，因此甲植株的基因型为aa，乙植株的基因型为Aa，丙植株为优良品种，且丙植株为纯合子，因此丙植株的基因型为RR，乙植株的基因型为aaRr。\n",
            "\n",
            "***************\n",
            "题目编号：8（含图片）\n",
            "题目标答：(1)(2)(3) (4) (5)\n",
            "Yi 34B 模型输出：(1) 使用显微镜直接计数法（也称为活体计数法）时，计数的是所有细菌细胞，包括活菌和死菌，以及一些不能形成菌落的细菌细胞（如处于休眠状态的细菌）。而菌落计数法（也称为稀释涂布平板法）只能计数那些能够形成可见菌落的单个活细菌细胞。因此，显微镜直接计数法得到的细菌数量通常会大于菌落计数法的结果，原因是在显微镜下计数的细菌包括了不能形成菌落的细菌细胞和死菌细胞。\n",
            "\n",
            "(2) 该同学从100 mL细菌原液中取1 mL加入无菌水得到10 mL稀释菌液，这意味着原液被稀释了100倍。从稀释菌液中取200 μL涂布平板，菌落计数的结果为100。由于200 μL只占稀释后的10 mL中的很小一部分，我们可以假设这200 μL中的细菌数量代表了整个10 mL稀释菌液中的细菌数量。因此，10 mL稀释菌液中有100个菌落，即每mL中有10个菌落。由于原液被稀释了100倍，所以原液中每mL的细菌菌落数为10 * 100 = 1000个。\n",
            "\n",
            "(3) 菌落计数过程中，涂布器先在酒精灯上灼烧是为了杀死涂布器上的任何微生物，以避免污染培养基和确保计数的准确性。冷却后再涂布是为了防止高温对培养基或细菌细胞造成伤害，确保涂布过程不会因过热而影响细菌的存活和生长。\n",
            "\n",
            "(4) 根据图中所示，消毒液B和C在所有时间点上均能有效减少细菌数量，而消毒液A在较短时间后细菌数量有所回升，表明其杀菌效果不如B和C。因此，杀菌效果最好的消毒液是B和C。判断依据包括：\n",
            "- 消毒液B和C在所有时间点上都能显著减少细菌数量，而A不能。\n",
            "- 消毒液B和C在较长时间后仍然保持较低的细菌数量，而A在较短时间后细菌数量有所回升。\n",
            "\n",
            "(5) 大肠杆菌在伊红美蓝培养基上生长的菌落呈黑色。伊红美蓝培养基是一种用于鉴别大肠杆菌的培养基，它能够使大肠杆菌的菌落呈现出黑色，这是由于大肠杆菌能够发酵乳糖产生大量的醋酸和色素，这些物质与伊红美蓝结合形成黑色沉淀，从而使得菌落呈黑色。\n",
            "***************\n",
            "题目编号：9（含图片）\n",
            "题目标答：(1) 不相等 温度a和c时的呼吸速率不相等(2)温度d时，叶片的光合速率与呼吸速率相等，但植物的根部等细胞不进行光合作用，仍呼吸消耗有机物，导致植物体的干重减少(3)温度过高，导致部分气孔关闭，CO<sub>2</sub>供应不足，暗反应速率降低；温度过高，导致酶的活性降低，使暗反应速率降低(4)光合速率和呼吸速率差值\n",
            "Yi 34B 模型输出：【分析】\n",
            "本题考查光合作用和呼吸作用的相关知识，要求考生识记光合作用和呼吸作用的具体过程，掌握影响光合作用和呼吸作用的环境因素，能结合图中信息准确答题。\n",
            "<span>根据题图分析，温度为a时，植物净光合速率为0，实际光合速率等于呼吸速率；温度为b时，植物呼吸速率达到最大值；温度为c时，植物净光合速率等于呼吸速率。</span>\n",
            "<span>【解答】</span>\n",
            "<span>（1）该植物叶片在温度a和c时的光合速率相等，但叶片有机物积累速率不相等，原因是温度为a时，植物实际光合速率等于呼吸速率，而温度为c时，植物净光合速率等于呼吸速率。</span>\n",
            "<span>（2）在温度d时，该植物体的干重会减少，原因是呼吸速率大于光合速率，有机物被消耗。</span>\n",
            "<span>（3）温度超过b时，该植物由于暗反应速率降低导致光合速率降低。暗反应速率降低的原因可能是温度过高，导致酶的活性降低（或二氧化碳浓度降低）。</span>\n",
            "<span>（4）通常情况下，为了最大程度地获得光合产物，农作物在温室栽培过程中，白天温室的温度应控制在光合速率或净光合速率最大时的温度，即在b点对应的温度。</span>\n",
            "\n",
            "\n",
            "***************\n",
            "题目编号：10\n",
            "题目标答：(1)体液免疫(2)肽键(3)实验思路：以蛋白质A的片段为抗原，制备单克隆抗体，利用差速离心法将吞噬细胞中的溶酶体分离，并提取溶酶体中的蛋白质，利用抗原抗体杂交技术进行检测预期结果：出现杂交带，表明蛋白质A的片段可出现在吞噬细胞的溶酶体中\n",
            "Yi 34B 模型输出：【分析】\n",
            "本题考查人体免疫系统在维持稳态中的作用，要求考生识记人体免疫系统的组成及功能，掌握体液免疫和细胞免疫的具体过程，能结合所学的知识准确答题。\n",
            "\n",
            "***************\n",
            "题目编号：11\n",
            "题目标答：(1)在原地对被保护的生态系统或物种建立自然保护区以及国家公园等(2)天敌、竞争者、食物等(3)存在环境阻力(4)增加生物多样性\n",
            "Yi 34B 模型输出：【分析】\n",
            "本题考查种群和生物多样性的相关知识，要求考生识记种群的概念和特征，明确种群呈“S”型增长的主要原因是受资源和空间限制；识记生物多样性的保护措施，能结合所学的知识准确答题。\n",
            "【解答】\n",
            "（1）保护鸟类B采取“就地保护为主，易地保护为辅”模式。就地保护是建立自然保护区。\n",
            "（2）鸟类B经人工繁育达到一定数量后可放飞野外。为保证鸟类B正常生存繁殖，放飞前需考虑的野外生物因素有食物、天敌等。\n",
            "（3）鸟类B的野生种群稳步增长。通常，种群呈“S”型增长的主要原因是受资源和空间限制。\n",
            "（4）保护鸟类B等濒危物种的意义是保护生物多样性，保护生物多样性利用的意义是在生态、经济、科研和美学等方面。\n",
            "\n",
            "***************\n",
            "题目编号：12（含图片）\n",
            "题目标答：(1) 变性 氢键(2) 避免目的基因和质粒的任意连接、防止目的基因和质粒的自身环化 T<sub>4</sub>DNA连接酶(3) 细胞处于一种能吸收周围环境中DNA分子的生理状态 利用DNA分子杂交技术，将大肠杆菌的基因组DNA提取出来，在含有目的基因的DNA片段上用放射性同位素等作标记，以此作为探针，使探针与基因组DNA杂交，如果显示出杂交带，表明大肠杆菌中含有重组质粒(4)甘氨酸-脯氨酸-丝氨酸\n",
            "Yi 34B 模型输出：(1) 变性阶段\n",
            "氢键\n",
            "(2) 避免酶切片段之间的粘性末端相互连接；T<sub>4</sub> DNA连接酶\n",
            "(3) 细胞膜的通透性增大，能吸收质粒DNA；在培养基中长出 colonies\n",
            "(4) Gly-Ser-Lys\n",
            "\n",
            "(1) 在PCR过程中，变性阶段通过高温使DNA双链打开成为单链。引物与模板DNA链碱基之间通过氢键结合。\n",
            "\n",
            "(2) 使用酶a和酶b双酶切可以避免酶切片段之间的粘性末端相互连接，从而减少自我环化等不需要的连接。由于酶c切割产生的粘性末端有一个缺口，因此需要T<sub>4</sub> DNA连接酶这种具有缺口修复功能的连接酶。\n",
            "\n",
            "(3) 感受态细胞是经过处理的细胞，其细胞膜的通透性增大，能吸收质粒DNA。为了验证转化的大肠杆菌中含有重组质粒，可以将转化后的细胞接种在含抗生素的培养基上，如果细胞能够生长形成 colonies，说明重组质粒已被成功转入。\n",
            "\n",
            "(4) 若第一个核苷酸G缺失，则密码子变为“CCCAAGCTGAGATGA”。根据密码子表，突变后的肽链序列将是 Gly-Ser-Lys（甘氨酸-丝氨酸-赖氨酸）。\n"
          ]
        }
      ],
      "source": [
        "subject, paper_type = \"生物\", \"全国甲卷\"\n",
        "file_name = f\"../data/{paper_type}/{subject}.jsonl\"\n",
        "\n",
        "terminators = [\n",
        "    tokenizer.eos_token_id,\n",
        "    tokenizer.convert_tokens_to_ids(\"<|eot_id|>\"),\n",
        "    tokenizer.convert_tokens_to_ids(\"<|im_end|>\")\n",
        "]\n",
        "\n",
        "questions = []\n",
        "\n",
        "print(f\"试卷名：{paper_type} 高考真题 【{subject}】学科\")\n",
        "\n",
        "with open(file_name, \"r\") as f:\n",
        "    for i, line in enumerate(f):\n",
        "        data = json.loads(line)\n",
        "        has_img, question = False, data['prompt']\n",
        "\n",
        "        if '<img' in question:\n",
        "            has_img = True\n",
        "            question = re.sub(r'<img[^>]*?/>', \"\", question)\n",
        "\n",
        "        input_ids = tokenizer.apply_chat_template(conversation=[{\"role\": \"user\", \"content\": question}], \n",
        "                                                tokenize=True, \n",
        "                                                add_generation_prompt=True, \n",
        "                                                return_tensors='pt')\n",
        "        output_ids = model.generate(input_ids.to(device), eos_token_id=terminators, **gen_kwargs)\n",
        "        response = tokenizer.decode(output_ids[0][input_ids.shape[1]:], skip_special_tokens=True)\n",
        "\n",
        "        if i == 0:\n",
        "            print(\"*\" * 35)\n",
        "        else:\n",
        "            print(\"*\" * 15)\n",
        "\n",
        "        print(\"题目编号：\" + str(i+1) + (\"（含图片）\" if has_img else \"\"))\n",
        "        print(\"题目标答：\" + data[\"answer\"])\n",
        "        print(\"Yi 34B 模型输出：\" + response)\n",
        "            \n",
        "        questions.append({\n",
        "            \"id\": str(i+1),\n",
        "            \"question\": question,\n",
        "            \"answer\": data[\"answer\"],\n",
        "            \"output\": response,\n",
        "            \"has_img\": has_img\n",
        "        })"
      ]
    }
  ],
  "metadata": {
    "kernelspec": {
      "display_name": "base",
      "language": "python",
      "name": "python3"
    },
    "language_info": {
      "codemirror_mode": {
        "name": "ipython",
        "version": 3
      },
      "file_extension": ".py",
      "mimetype": "text/x-python",
      "name": "python",
      "nbconvert_exporter": "python",
      "pygments_lexer": "ipython3",
      "version": "3.10.12"
    }
  },
  "nbformat": 4,
  "nbformat_minor": 2
}