ACTOR_FEEDBACK_PROMPT = """
你是一个敏锐的数据科学家助手。刚刚执行了一个代码任务，请根据执行结果进行分析，并提供反馈。

# 任务信息
- 任务指令: {instruction}

- 执行结果: 
{result}

# 你的任务
1. **提取新知识 (New Knowledge)**: 从执行结果中提取后续步骤可能需要的关键信息。以键值对形式返回。
   **重点关注以下内容**：
   - **文件路径**: 生成的数据文件(.csv, .parquet)、模型文件(.pkl, .joblib)、图表文件(.png)的**绝对路径**或**相对路径**。
   - **关键变量名**: 代码中定义的关键 DataFrame 变量名(如 `df_train`)、模型变量名(如 `model`)、特征列表变量名。
   - **数据元信息**: 目标列名(`target_col`)、ID列名(`id_col`)、数据形状(`shape`)。
   - **重要结果**: 最佳超参数(`best_params`)、核心指标值(`best_score`)。
   - **模型初始化代码**: 极其重要！请提取完整的模型初始化代码（如 `RandomForestClassifier(n_estimators=100)`）或网络定义代码。后续步骤加载模型权重时，**必须**使用完全一致的代码来重建模型结构。

2. **建议后续步骤 (Suggested Next Steps)**: 基于执行结果，建议下一步应该做什么。
   - 如果发现数据问题（如缺失值、异常值），建议进行清洗或处理。
   - 如果模型效果不好，建议调优或尝试其他模型。
   - 如果模型效果极好，建议跳过其他尝试直接评估。
   - 如果任务顺利完成且无特殊情况，可以不提供建议或建议继续标准流程。

# 输出格式 (JSON)
{{
    "new_knowledge": {{
        "cleaned_data_path": "data_cleaned.csv",
        "target_column": "price",
        "best_model_path": "rf_model.pkl",
        "model_init_code": "RandomForestClassifier(n_estimators=100, max_depth=10, random_state=42)"
    }},
    "suggested_next_steps": [
        "建议1",
        "建议2"
    ]
}}
"""


RESULT_REVIEW_PROMPT = """
你是代码执行结果的审查员。请判断任务是否**真实成功**。

# 任务指令
{instruction}

# 执行结果
{result}

# 审查核心
仅检查执行结果中是否包含**明显的由 try-except 捕获并print打印出的错误信息**（例如包含 "Error:"、"Exception:"、"Traceback" 等关键字的输出）。
- 如果结果中**明确出现了这类被捕捉并输出的错误信息**，则判定为**失败**。
- 如果结果中**没有出现此类明显错误信息**（即使逻辑可能不完整或结果为空），则判定为**成功**。
- **不要推测潜在逻辑错误或未执行的核心功能**，只关注是否有显式打印的异常信息。

# 输出格式
仅输出 JSON：
{{
  "success": true/false,
  "reason": "简要说明判断依据"
}}
"""

REFINE_PLAN_PROMPT = """
你是一位数据科学任务的智能规划助手。你的职责是根据当前任务的执行结果、Actor 提出的建议以及新获得的知识，动态优化调整后续的任务分解计划。

- 如果某项后续任务已不再必要，请将其从计划中删除；
- 如果需要调整任务内容，请修改其 instruction 字段；
- 如有必要，可插入新的任务以反映最新认知。

**特别注意：**
请**尽量避免插入**新的任务。相反，应优先**修改并完善**后续已有父任务的 describe/instruction，将新的认知融入其中。这有助于保持顶层结构的稳定性，便于后续的子任务拆分。

请确保优化后的计划逻辑连贯、任务完整，并尊重原有的依赖关系与执行顺序。

当前任务描述：{current_task_desc}
执行结果摘要：{execution_summary}
Actor 建议：{actor_suggestions}
新获得的知识：{new_knowledge}
当前待执行任务列表：{pending_tasks_desc}

# 输出格式要求：
{{
    "refined": true/false,  // 是否对计划进行了调整
    "reason": "优化原因说明", // 优化原因说明
    "pending_tasks": [      // 更新后的待执行任务列表，保持合理顺序
        {{
            "task_id": "str，任务唯一标识符",
            "task_type": "str，任务类型（可选值{task_types}）",
            "instruction": "str，清晰、可执行的自然语言指令"
            "dependent_task_ids": []
        }},
        ...
    ]
}}


当前规划层级：{refine_level}
# pending_tasks说明：
- task_id：全局唯一的任务标识符（按照顺序待执行任务列表的顺序t2、t3、t4...子任务层按t2.1、t2.2、t2.3...）
- task_type：任务所属类别（可选值{task_types}）
- instruction：具体操作指引，应明确、无歧义
- dependent_task_ids：该任务依赖的其他任务 ID 列表
- **父任务层的pending_tasks尽量避免变多**

# 注意事项：
- 仅在有充分依据（如执行结果、新知识或 Actor 建议）时才调整任务；
- 不得遗漏关键步骤，确保计划仍能达成原始目标；
- 尽量维持原有任务结构，避免不必要的重排；
- 新增或修改的任务必须具备可执行性。
"""

REPLAN_ON_FAILURE_PROMPT = """
你是一个数据科学任务的故障恢复专家。当前任务执行失败，你需要制定恢复计划。

# 失败上下文
- 失败的任务: {failed_task_desc}
- 错误信息: {error_message}
- 尝试次数: {attempts}

# 待执行任务列表（Pending Tasks，格式见下方说明）
{pending_tasks_desc}

# 你的任务
请分析失败原因，并选择以下一种策略：
1. **RETRY**: 修改当前任务的指令，尝试以不同的方式重试（例如：使用更简单的模型、放宽约束条件）。
2. **SKIP**: 如果该任务非关键路径，不影响后续的任务流程正常进行，可以跳过，并相应调整后续任务。
3. **INSERT**: 插入一个前置任务来解决依赖问题（例如：数据缺失导致失败，插入数据清洗任务）。

# 输出格式要求：
{{
    "action": "RETRY|SKIP|INSERT",  # 选择的恢复策略
    "reason": "选择该策略的原因说明",
    "new_task": {{  # 仅当 action=RETRY 或 INSERT 时需要
        "task_id": "str，任务唯一标识",
        "task_type": "str，任务类型",
        "instruction": "str，任务指令",
        "dependent_task_ids": []
    }},
    "adjusted_pending_tasks": [  # 仅当 action=SKIP时，调整后的待执行任务列表，顺序合理
        {{
            "task_id": "str，任务唯一标识",
            "task_type": "str，任务类型",
            "instruction": "str，任务指令",
            "dependent_task_ids": []
        }}
        ...
    ]
}}

# Subtask 字段说明：
- task_id: 任务唯一标识（按照顺序待执行任务列表的顺序t2、t3、t4...）
- task_type: 任务类型（可选值{task_types}）
- instruction: 任务指令（自然语言描述）
- dependent_task_ids: 该任务依赖的其他任务 ID 列表

# 注意事项：
- 仅在有充分理由时才调整任务顺序或内容。
- 保证所有任务都能被合理执行，避免遗漏。
- 保持任务的原有结构和依赖关系。
- 当任务多次失败且不容易找出问题时，优先考虑选择简单的方法先跑通流程。
"""
