{
  "cells": [
    {
      "cell_type": "markdown",
      "metadata": {},
      "source": [
        "# 试卷名：全国甲卷 高考真题 【地理】学科\n",
        "\n",
        "## 题目编号：1（含图片）\n",
        "## 题目标答\n",
        "ACD\n",
        "## WQX 模型输出\n",
        "1.D 2.C 3.B 中新合作区的工业区对商业区形成强力支撑的原因是工业区带动了人口集聚和地租递减。将中新合作区的住宅区规划在商业区和工业区之间，主要有利于组织内外交通。从苏州老城主干道向东延伸串联中新合作区各功能区，体现的布局思路是轴向发展。\n",
        "答案是：D\n",
        "\n",
        "--------\n",
        "## 题目编号：2\n",
        "## 题目标答\n",
        "BD\n",
        "## WQX 模型输出\n",
        "4.B 5.C 第4题，沼泽地地下水位较高，开垦为耕地后，需要降低地下水位，便于耕种。第5题，抽取的地下水在露天水池蓄存一段时间，可沉淀泥沙，便于灌溉。\n",
        "答案是：B; C\n",
        "\n",
        "--------\n",
        "## 题目编号：3（含图片）\n",
        "## 题目标答\n",
        "CBA\n",
        "## WQX 模型输出\n",
        "6.C 7.D 8.C\n",
        "\n",
        "--------\n",
        "## 题目编号：4（含图片）\n",
        "## 题目标答\n",
        "DAC\n",
        "## WQX 模型输出\n",
        "9.D 10.A 11.C\n",
        "\n",
        "--------\n",
        "## 题目编号：5（含图片）\n",
        "## 题目标答\n",
        "（1）纬度低，太阳高度角大，晴天时光照强，需要防晒：受赤道低压控制，午后多对流雨，需要防雨；热带沿海空气潮湿、闷热，草帽透气性好：沿海及附近低海拔地区盛产托奎拉草，原料丰富。\n",
        "(2）蒙特克里斯蒂草帽生产规模大，满足当地需求后，仍有大量盈余；蒙特克里斯蒂位罝偏僻，难以开拓国际市场；巴拿马地处南北美洲交汇处，扼巴拿马运河，为太平洋和大西洋的枢纽，地处重要国际航线，交通便利，辐射范围广，便于开拓海外市场；托奎拉草帽质量高且实用价值大，备受市场欢迎。\n",
        "（3）交通等配套基础设施的完善；原料的集中采购：启动资金的募集；劳动力的招募和培训；编织技术的学习和推广；贸易渠道的建立及国际市场的开拓。\n",
        "(4）提高机械化水平，优化生产工序，提高生产效率；加强手工艺人培训，做好技艺传承；加强宣传，提升品牌价值；开发文化创意产品，提升附加值；以草帽为基础，拓展产品类型，满足消费者多样化的需求；研发适合不同国家和地区的产品，贴近当地消费习惯。\n",
        "## WQX 模型输出\n",
        "(1)厄瓜多尔沿海及附近低海拔地区出产托奎拉草,原料丰富;托奎拉草新叶质地柔软且富有韧性,编织的草帽防晒、防雨、透气,适合当地自然环境。(6分)\n",
        "(2)巴拿马位于国际交通要道,交通便利;地处沿海地区,对外联系方便;是拉美地区重要的贸易中心,贸易公司建立于此,有利于拓展国际市场。(6分)\n",
        "(3)加强托奎拉草种植区的管理,保证托奎拉草的产量和质量;建立托奎拉草帽编织技术培训中心,提高编织工人的技术水平;完善基础设施,提高物流服务水平。(6分)\n",
        "(4)加大科技投入,提高托奎拉草帽编织技术,降低生产成本;拓展托奎拉草帽销售渠道,扩大销售市场;加大宣传力度,提高托奎拉草帽的国际知名度;开发托奎拉草帽新产品,增加托奎拉草帽的种类。(6分)\n",
        "\n",
        "--------\n",
        "## 题目编号：6（含图片）\n",
        "## 题目标答\n",
        "（1）新石器时代遗址数量多，汉代遗址数量少，说明新石器时代更多区域为陆地更适合人类活动，而汉代河网湖沼广布；新石器时代遗址分布广泛，汉代遗址仅分布在西侧，说明中东侧（下游方向）河网湖沼扩张。\n",
        "(2）堤坝修筑导致洪水被约束在河床，难以向外漫溢：洪水流速快，输沙总量大，（当水量减小、流速减慢时）泥沙主要在河床沉积，导致河床增高；为了达到较好的防洪效果，随着河床抬升，人们加高大堤，该过程循环持续。\n",
        "(3）宋代之前，洞庭湖入湖水量主要来自湘、资、沅、澧四水，流域纬度较低，春季受冷暖气团交绥影响，多降水，入湖径流量大：随着长江河床抬高，长江倒灌进入洞庭湖的水量增大：与四水流域相比，长江流域纬度较高，雨带控制较晚；长江河床抬升导致洞庭湖水排泄受阻，叠加洞庭湖湖盆泥沙淤积，洪水期延长，出现夏秋连涨；气候变化导致夏季降水量增大。\n",
        "（4）洞庭湖地区构造沉降，湖盆扩张：受人类活动破坏植被等影响，长江上游及湘、资、沅、澧四水流域水士流失加剧，注入洞庭湖的泥沙增加，泥沙在湖区沉积，导致湖盆变浅；湖盆变浅，相同的水量其水位更高，面积更大。\n",
        "## WQX 模型输出\n",
        "(1)遗址分布密集,说明新石器时代该地区河网交错,湖沼广布。(2分)遗址分布稀疏,说明汉代该地区河网交错,湖沼广布。(4分)\n",
        "(2)荆江堤坝修筑后,荆江河道束窄,流速加快,侵蚀作用增强,荆江河床不断加深;洞庭湖面积扩大,接纳荆江河床中大量泥沙,荆江河床相对堤外不断增高。(4分)\n",
        "(3)宋代以来,长江含沙量持续增加,洞庭湖接纳长江的泥沙量增加,湖底抬升,湖泊蓄水量减少,湖泊对长江洪水的调节作用减弱,导致洞庭湖洪水由“春溜满涨”为主逐渐转变为“夏秋连涨”为主。(8分)\n",
        "(4)宋代以来,长江含沙量持续增加,洞庭湖接纳长江的泥沙量增加,湖底抬升,湖泊蓄水量减少,湖泊对长江洪水的调节作用减弱,导致洞庭湖洪水由“春溜满涨”为主逐渐转变为“夏秋连涨”为主。(4分)\n",
        "\n",
        "--------\n",
        "## 题目编号：7\n",
        "## 题目标答\n",
        "示例：\n",
        "选择世界文化遗产地：京杭大运河\n",
        "文化旅游产品名称：大运河沉浸式实景演出\n",
        "产品概述；游客乘坐具有江南水乡特色的乌篷船，驶入京杭大运河杭州段；船夫身着古装，船上其他工作人员模拟历史上商人在轮船上的交谈和娱乐：两岸通过灯光，利用物联网等手段营造历史环境，再现历史时期商贾繁忙的场景;游客可以自己选择下船地点，自由与两岸任意扮演商贾的工作人员交谈，购买文创纪念等产品；两岸餐馆经营特色美食，游客身临其境以提前领取的吉代货币开展交易；沿线随机安排展现历史生活场景的演出片段，游客可随意与演员交流。\n",
        "## WQX 模型输出\n",
        "旅游产品设计:深度体验当地文化,参与当地人的日常生活,如住特色民居,吃当地美食,体验当地人的衣食住行等。(2分)设计思路:结合当地自然和人文旅游资源,设计具有特色的旅游活动项目,如研学、康养、运动等。(2分)设计原则:体验性、参与性、安全性、教育性等。(2分)\n",
        "\n",
        "--------\n",
        "## 题目编号：8\n",
        "## 题目标答\n",
        "示例\n",
        "实验选择名称：“以水定绿”理念下的灌草种植方式研宄\n",
        "条带状种植灌木或草本植物，通过控制变量，测定不同条带宽度其下风向的风速、风沙拦截量和地下水位：通过控制变量，测定灌木或草本植物不同条带组合的数据；对比多组数据，选择下风向风速较低、风沙拦截量较大和地下水位较高的组合。\n",
        "## WQX 模型输出\n",
        "在迎风面不同地形(坡度)上,分别栽种灌木、草本植物和灌草混种,其他条件相同。(2分)在三种栽种方式中,以相同时间内的阻沙量(或沙面覆盖度)作为评价指标,比较其阻沙效果。(2分)\n"
      ]
    },
    {
      "cell_type": "code",
      "execution_count": 1,
      "metadata": {},
      "outputs": [
        {
          "data": {
            "application/vnd.jupyter.widget-view+json": {
              "model_id": "8a2ce52351624991b340eaaa4c4cdd3e",
              "version_major": 2,
              "version_minor": 0
            },
            "text/plain": [
              "Loading checkpoint shards:   0%|          | 0/4 [00:00<?, ?it/s]"
            ]
          },
          "metadata": {},
          "output_type": "display_data"
        }
      ],
      "source": [
        "import re\n",
        "import json\n",
        "\n",
        "import torch\n",
        "from transformers import AutoTokenizer, AutoModelForCausalLM\n",
        "\n",
        "device = torch.device(\"cuda\")\n",
        "\n",
        "model_path = \"WQX-20b\"\n",
        "gen_kwargs = {\"max_length\": 2048, \"do_sample\": False}\n",
        "\n",
        "tokenizer = AutoTokenizer.from_pretrained(\n",
        "    model_path, trust_remote_code=True,\n",
        ")\n",
        "model = AutoModelForCausalLM.from_pretrained(\n",
        "    model_path,\n",
        "    trust_remote_code=True,\n",
        "    torch_dtype=torch.float16,\n",
        ").eval().to(device)\n"
      ]
    },
    {
      "cell_type": "code",
      "execution_count": 2,
      "metadata": {},
      "outputs": [
        {
          "name": "stdout",
          "output_type": "stream",
          "text": [
            "试卷名：全国甲卷 高考真题 【地理】学科\n",
            "***********************************\n",
            "题目编号：1（含图片）\n",
            "题目标答：ACD\n",
            "WQX 模型输出：1.D 2.C 3.B 中新合作区的工业区对商业区形成强力支撑的原因是工业区带动了人口集聚和地租递减。将中新合作区的住宅区规划在商业区和工业区之间，主要有利于组织内外交通。从苏州老城主干道向东延伸串联中新合作区各功能区，体现的布局思路是轴向发展。\n",
            "答案是：D\n",
            "***************\n",
            "题目编号：2\n",
            "题目标答：BD\n",
            "WQX 模型输出：4.B 5.C 第4题，沼泽地地下水位较高，开垦为耕地后，需要降低地下水位，便于耕种。第5题，抽取的地下水在露天水池蓄存一段时间，可沉淀泥沙，便于灌溉。\n",
            "答案是：B; C\n",
            "***************\n",
            "题目编号：3（含图片）\n",
            "题目标答：CBA\n",
            "WQX 模型输出：6.C 7.D 8.C\n",
            "***************\n",
            "题目编号：4（含图片）\n",
            "题目标答：DAC\n",
            "WQX 模型输出：9.D 10.A 11.C\n",
            "***************\n",
            "题目编号：5（含图片）\n",
            "题目标答：（1）纬度低，太阳高度角大，晴天时光照强，需要防晒：受赤道低压控制，午后多对流雨，需要防雨；热带沿海空气潮湿、闷热，草帽透气性好：沿海及附近低海拔地区盛产托奎拉草，原料丰富。\n",
            "(2）蒙特克里斯蒂草帽生产规模大，满足当地需求后，仍有大量盈余；蒙特克里斯蒂位罝偏僻，难以开拓国际市场；巴拿马地处南北美洲交汇处，扼巴拿马运河，为太平洋和大西洋的枢纽，地处重要国际航线，交通便利，辐射范围广，便于开拓海外市场；托奎拉草帽质量高且实用价值大，备受市场欢迎。\n",
            "（3）交通等配套基础设施的完善；原料的集中采购：启动资金的募集；劳动力的招募和培训；编织技术的学习和推广；贸易渠道的建立及国际市场的开拓。\n",
            "(4）提高机械化水平，优化生产工序，提高生产效率；加强手工艺人培训，做好技艺传承；加强宣传，提升品牌价值；开发文化创意产品，提升附加值；以草帽为基础，拓展产品类型，满足消费者多样化的需求；研发适合不同国家和地区的产品，贴近当地消费习惯。\n",
            "WQX 模型输出：(1)厄瓜多尔沿海及附近低海拔地区出产托奎拉草,原料丰富;托奎拉草新叶质地柔软且富有韧性,编织的草帽防晒、防雨、透气,适合当地自然环境。(6分)\n",
            "(2)巴拿马位于国际交通要道,交通便利;地处沿海地区,对外联系方便;是拉美地区重要的贸易中心,贸易公司建立于此,有利于拓展国际市场。(6分)\n",
            "(3)加强托奎拉草种植区的管理,保证托奎拉草的产量和质量;建立托奎拉草帽编织技术培训中心,提高编织工人的技术水平;完善基础设施,提高物流服务水平。(6分)\n",
            "(4)加大科技投入,提高托奎拉草帽编织技术,降低生产成本;拓展托奎拉草帽销售渠道,扩大销售市场;加大宣传力度,提高托奎拉草帽的国际知名度;开发托奎拉草帽新产品,增加托奎拉草帽的种类。(6分)\n",
            "***************\n",
            "题目编号：6（含图片）\n",
            "题目标答：（1）新石器时代遗址数量多，汉代遗址数量少，说明新石器时代更多区域为陆地更适合人类活动，而汉代河网湖沼广布；新石器时代遗址分布广泛，汉代遗址仅分布在西侧，说明中东侧（下游方向）河网湖沼扩张。\n",
            "(2）堤坝修筑导致洪水被约束在河床，难以向外漫溢：洪水流速快，输沙总量大，（当水量减小、流速减慢时）泥沙主要在河床沉积，导致河床增高；为了达到较好的防洪效果，随着河床抬升，人们加高大堤，该过程循环持续。\n",
            "(3）宋代之前，洞庭湖入湖水量主要来自湘、资、沅、澧四水，流域纬度较低，春季受冷暖气团交绥影响，多降水，入湖径流量大：随着长江河床抬高，长江倒灌进入洞庭湖的水量增大：与四水流域相比，长江流域纬度较高，雨带控制较晚；长江河床抬升导致洞庭湖水排泄受阻，叠加洞庭湖湖盆泥沙淤积，洪水期延长，出现夏秋连涨；气候变化导致夏季降水量增大。\n",
            "（4）洞庭湖地区构造沉降，湖盆扩张：受人类活动破坏植被等影响，长江上游及湘、资、沅、澧四水流域水士流失加剧，注入洞庭湖的泥沙增加，泥沙在湖区沉积，导致湖盆变浅；湖盆变浅，相同的水量其水位更高，面积更大。\n",
            "WQX 模型输出：(1)遗址分布密集,说明新石器时代该地区河网交错,湖沼广布。(2分)遗址分布稀疏,说明汉代该地区河网交错,湖沼广布。(4分)\n",
            "(2)荆江堤坝修筑后,荆江河道束窄,流速加快,侵蚀作用增强,荆江河床不断加深;洞庭湖面积扩大,接纳荆江河床中大量泥沙,荆江河床相对堤外不断增高。(4分)\n",
            "(3)宋代以来,长江含沙量持续增加,洞庭湖接纳长江的泥沙量增加,湖底抬升,湖泊蓄水量减少,湖泊对长江洪水的调节作用减弱,导致洞庭湖洪水由“春溜满涨”为主逐渐转变为“夏秋连涨”为主。(8分)\n",
            "(4)宋代以来,长江含沙量持续增加,洞庭湖接纳长江的泥沙量增加,湖底抬升,湖泊蓄水量减少,湖泊对长江洪水的调节作用减弱,导致洞庭湖洪水由“春溜满涨”为主逐渐转变为“夏秋连涨”为主。(4分)\n",
            "***************\n",
            "题目编号：7\n",
            "题目标答：示例：\n",
            "选择世界文化遗产地：京杭大运河\n",
            "文化旅游产品名称：大运河沉浸式实景演出\n",
            "产品概述；游客乘坐具有江南水乡特色的乌篷船，驶入京杭大运河杭州段；船夫身着古装，船上其他工作人员模拟历史上商人在轮船上的交谈和娱乐：两岸通过灯光，利用物联网等手段营造历史环境，再现历史时期商贾繁忙的场景;游客可以自己选择下船地点，自由与两岸任意扮演商贾的工作人员交谈，购买文创纪念等产品；两岸餐馆经营特色美食，游客身临其境以提前领取的吉代货币开展交易；沿线随机安排展现历史生活场景的演出片段，游客可随意与演员交流。\n",
            "WQX 模型输出：旅游产品设计:深度体验当地文化,参与当地人的日常生活,如住特色民居,吃当地美食,体验当地人的衣食住行等。(2分)设计思路:结合当地自然和人文旅游资源,设计具有特色的旅游活动项目,如研学、康养、运动等。(2分)设计原则:体验性、参与性、安全性、教育性等。(2分)\n",
            "***************\n",
            "题目编号：8\n",
            "题目标答：示例\n",
            "实验选择名称：“以水定绿”理念下的灌草种植方式研宄\n",
            "条带状种植灌木或草本植物，通过控制变量，测定不同条带宽度其下风向的风速、风沙拦截量和地下水位：通过控制变量，测定灌木或草本植物不同条带组合的数据；对比多组数据，选择下风向风速较低、风沙拦截量较大和地下水位较高的组合。\n",
            "WQX 模型输出：在迎风面不同地形(坡度)上,分别栽种灌木、草本植物和灌草混种,其他条件相同。(2分)在三种栽种方式中,以相同时间内的阻沙量(或沙面覆盖度)作为评价指标,比较其阻沙效果。(2分)\n"
          ]
        }
      ],
      "source": [
        "subject, paper_type = \"地理\", \"全国甲卷\"\n",
        "file_name = f\"../data/{paper_type}/{subject}.jsonl\"\n",
        "\n",
        "questions = []\n",
        "\n",
        "print(f\"试卷名：{paper_type} 高考真题 【{subject}】学科\")\n",
        "\n",
        "with open(file_name, \"r\") as f:\n",
        "    for i, line in enumerate(f):\n",
        "        data = json.loads(line)\n",
        "        has_img, question = False, data['prompt']\n",
        "\n",
        "        if '<img' in question:\n",
        "            has_img = True\n",
        "            question = re.sub(r'<img[^>]*?/>', \"\", question)\n",
        "\n",
        "        inputs = tokenizer(question, return_tensors=\"pt\")\n",
        "        input_ids = inputs[\"input_ids\"].to(device)\n",
        "\n",
        "        outputs = model.generate(input_ids, **gen_kwargs)\n",
        "        outputs = outputs[0].cpu().tolist()[len(inputs[\"input_ids\"][0]) :]\n",
        "\n",
        "        response = tokenizer.decode(outputs, skip_special_tokens=True)\n",
        "        response = response.split(\"<|im_end|>\")[0]\n",
        "\n",
        "        if i == 0:\n",
        "            print(\"*\" * 35)\n",
        "        else:\n",
        "            print(\"*\" * 15)\n",
        "\n",
        "        print(\"题目编号：\" + str(i+1) + (\"（含图片）\" if has_img else \"\"))\n",
        "        print(\"题目标答：\" + data[\"answer\"])\n",
        "        print(\"WQX 模型输出：\" + response)\n",
        "            \n",
        "        questions.append({\n",
        "            \"id\": str(i+1),\n",
        "            \"question\": question,\n",
        "            \"answer\": data[\"answer\"],\n",
        "            \"output\": response,\n",
        "            \"has_img\": has_img\n",
        "        })"
      ]
    }
  ],
  "metadata": {
    "kernelspec": {
      "display_name": "base",
      "language": "python",
      "name": "python3"
    },
    "language_info": {
      "codemirror_mode": {
        "name": "ipython",
        "version": 3
      },
      "file_extension": ".py",
      "mimetype": "text/x-python",
      "name": "python",
      "nbconvert_exporter": "python",
      "pygments_lexer": "ipython3",
      "version": "3.10.12"
    }
  },
  "nbformat": 4,
  "nbformat_minor": 2
}
