# 文件名: config_rl.py

import os
from dotenv import load_dotenv

# 加载 .env 文件中的环境变量，这样API密钥可以被安全地管理
load_dotenv()

# --- LLM & API Configuration ---
# 从环境变量中获取API密钥，请确保您的 .env 文件中有 YUNWU_API_KEY='sk-...'
LLM_API_KEY = os.environ.get("YUNWU_API_KEY")
LLM_API_BASE = "https://yunwu.ai/v1"
LLM_MODEL = "gemini-2.5-pro-thinking-512"

# --- Path Configuration ---
# 包含 scene_XXXXXX.json 文件的元数据目录
METADATA_DIR = "/data2/wl/RL_benchmark/data/metadata"
# 包含已生成的 scene_XXXXXX.txt 文件的RTSD缓存目录
RTSD_CACHE_DIR = "/data2/wl/RL_benchmark/output/rtsd_cache"
# 所有生成物的根输出目录
OUTPUT_DIR = "/data2/wl/RL_benchmark/output/benchmark"
# 存放所有Prompt模板的目录
PROMPT_DIR = "prompts"
# 最终生成的Benchmark数据集文件名
FINAL_BENCHMARK_PATH = os.path.join(OUTPUT_DIR, "benchmark_questions.jsonl")


# --- Generation Control ---
# 通过命令行参数控制，这里是默认值
DEFAULT_TOTAL_QUESTIONS = 10000
# 并行处理的线程数，可以根据您的网络和API速率限制进行调整
MAX_WORKERS = 128
# LLM无法生成内容时返回的约定关键字
UNABLE_TO_GENERATE_KEYWORD = "UNABLE_TO_GENERATE"


# --- Task Distribution ---
# 1. 定义每个大类下的具体任务 (必须与prompts目录下的文件名一一对应, 不含.txt)
PERCEPTION_TASKS = [
    "perception_count",
    "perception_content_id",
    "perception_environment"
]

INTEGRATION_TASKS = [
    "integration_attribute_binding",
    "integration_content_to_location",
    "integration_location_to_content"
]

REASONING_TASKS = [
    "reasoning_causal_intent",
    "reasoning_counterfactual",
    "reasoning_scene_summary",
    "reasoning_spatial_relationship"
]

# 2. 定义三大类之间的分布比例
TASK_DISTRIBUTION = {
    'perception': 0.3,
    'integration': 0.3,
    'reasoning': 0.4
}

# 将所有任务类型合并到一个列表中，方便后续处理
ALL_TASKS = PERCEPTION_TASKS + INTEGRATION_TASKS + REASONING_TASKS

RTSD_BASE_TEMPLATE = """
场景事实：
1. 场景类型: {% if scene_type == 'speech' %}纯人声对话场景{% elif scene_type == 'music' %}纯音乐场景{% else %}混合背景声场景{% endif %}
2. 声源数量: 场景中共有 {{ source_count }} 个独立声源。
3. 声源详情:
{% for event in source_events %}
   - 声源 {{ loop.index }}:
{% if event.transcript %}
     - 声音类别: {{ event['class'] }} (人声)
     - 说话内容: "{{ event.transcript }}"
{% else %}
     - 声音类别或描述: {{ event['class'] }}
{% endif %}
     - 相对位置: 方位角 {{ event.azimuth | round }} 度, 仰角 {{ event.elevation | round }} 度
     - 相对距离: {{ event.distance | round(1) }} 米
{% endfor %}
4. 环境声学信息:
   - 混响类型: {% if room_acoustics.reverb_type == 'anechoic' %}无混响 (直达声){% else %}普通室内混响{% endif %}
   - 房间尺寸类别: {{ room_acoustics.size_category }}
   - 混响感类别: {{ room_acoustics.reverb_category }}
   - 具体尺寸 (长x宽x高): {{ room_acoustics.dimensions_m[0] | round(1) }}m x {{ room_acoustics.dimensions_m[1] | round(1) }}m x {{ room_acoustics.dimensions_m[2] | round(1) }}m
   - 混响时间 (RT60): {{ room_acoustics.rt60_s | round(2) }} 秒
5. 坐标系定义:
    - 方位角为0度时，表示正前方；
    - 方位角在0度到90度之间时，表示右前方；
    - 方位角为90度时，表示正右方；
    - 方位角在90度到180度之间时，表示右后方；
    - 方位角为180度时，表示正后方；
    - 方位角在180度到270度之间时，表示左后方；
    - 方位角为270度时，表示正左方；
    - 方位角在270度到360度之间时，表示左前方；
    - 俯仰角为0度时，表示水平面；俯仰角为90度时，表示正上方；俯仰角为-90度时，表示正下方。
"""

# 用于请求LLM润色基础描述的指令 (保持不变)
RTSD_REFINEMENT_PROMPT = """
你是一个专业的场景描述作家。请将以下提供的、由程序生成的结构化场景信息，改写成一段流畅、自然、信息完整的中文文本段落。请使用更生活化的语言来描述方位，并确保所有原始数据信息都被准确无误地包含在内。

- 在描述方位信息时，除前、后、左、右、上、下这类粗略方位描述，也需要给出方位角和俯仰角的精确角度（保留整数部分）
- 只需要返回中文的自然语言描述，不要附带任何其他的内容。

[结构化信息]
{{base_description}}

[改写后的自然语言描述]
"""

# --- SFT Data Generation Configuration ---
# 这是我们之前生成的、包含问题/选项/答案/元数据的Benchmark文件
BENCHMARK_FILE_PATH = os.path.join(OUTPUT_DIR, "benchmark_questions.jsonl")

# SFT数据最终输出的路径
SFT_OUTPUT_PATH = os.path.join(OUTPUT_DIR, "sft_data.jsonl")

# 指导教师LLM生成思维链的Prompt模板文件名
SFT_TEACHER_PROMPT_NAME = "sft_teacher_prompt" # 无需.txt后缀