# Orchestra Core - 多智能体编排框架

Orchestra Core 是一个通用的多智能体编排框架，实现了 MainAgent-SubAgent 的双层架构模式。

## 核心架构

```
┌─────────────────────────────────────────────────────────────┐
│                      OrchestraRunner                        │
│  ┌───────────────────────────────────────────────────────┐  │
│  │                     MainAgent                          │  │
│  │  • 任务分析和规划                                       │  │
│  │  • 选择模型和制定子任务                                 │  │
│  │  • 根据反馈决策（继续/完成）                            │  │
│  └───────────────┬───────────────────────────────────────┘  │
│                  │ delegate_task                            │
│                  ▼                                          │
│  ┌───────────────────────────────────────────────────────┐  │
│  │                     SubAgent                           │  │
│  │  • 在隔离环境中执行                                     │  │
│  │  • 与环境交互（execute/finish）                         │  │
│  │  • 报告执行结果                                         │  │
│  └───────────────┬───────────────────────────────────────┘  │
│                  │                                          │
│                  ▼                                          │
│  ┌───────────────────────────────────────────────────────┐  │
│  │                   Environment                          │  │
│  │  • Docker / E2B / Daytona / Local                      │  │
│  │  • 命令执行和结果返回                                   │  │
│  │  • 任务验证                                             │  │
│  └───────────────────────────────────────────────────────┘  │
└─────────────────────────────────────────────────────────────┘
```

## 核心组件

### 1. MainAgent (主编排智能体)

负责任务编排和决策：
- 分析任务需求，制定执行策略
- 选择合适的模型和工具
- 根据 SubAgent 反馈决定下一步

```python
from orchestra_core import MainAgent

agent = MainAgent(
    llm=llm_instance,
    sub_models=["model_a", "model_b"],
    tools=[delegate_tool, submit_tool],
    prompt_builder=TaskExecutionPrompt,
)
```

### 2. SubAgent (执行智能体)

在隔离环境中执行具体任务：
- 执行 shell 命令
- 与环境交互
- 通过 `finish` 报告结果

```python
from orchestra_core import SubAgent

agent = SubAgent(
    llm=llm_instance,
    context="Additional context from MainAgent",
    allowed_tools=["execute", "finish"],
)
```

### 3. OrchestraRunner (编排运行器)

管理整个编排流程：
- 创建和初始化 MainAgent
- 运行编排循环
- 保存执行轨迹

```python
from orchestra_core import OrchestraRunner

runner = OrchestraRunner(
    main_model="main_model",
    sub_models=["sub_a", "sub_b"],
    max_attempts=10,
    prompt_builder=TaskExecutionPrompt,
)
result = await runner.run(env, tools_factory)
```

### 4. 工具 (Tools)

MainAgent 使用的核心工具：
- `DelegateTaskTool`: 委派任务给 SubAgent
- `SubmitTool`: 提交任务进行验证
- `CompleteTool`: 标记任务完成（问答类）

## 使用示例

```python
import asyncio
from orchestra_core import (
    OrchestraRunner,
    OrchestraConfig,
    SubAgentRunner,
)
from orchestra_core.prompts import TaskExecutionPrompt
from orchestra_core.tools import DelegateTaskTool, SubmitTool

# 1. 加载配置
config = OrchestraConfig.load("config.yaml")

# 2. 定义 LLM 工厂
def llm_factory(model_name: str):
    # 返回 LLM 实例
    return create_llm(model_name)

# 3. 定义工具工厂
def tools_factory(env, sub_runner):
    return [
        DelegateTaskTool(
            env=env,
            runner=sub_runner,
            models=config.sub_models,
            llm_factory=llm_factory,
        ),
        SubmitTool(env=env),
    ]

# 4. 创建运行器
runner = OrchestraRunner(
    main_model=config.main_model,
    sub_models=config.sub_models,
    max_attempts=config.max_attempts,
    prompt_builder=TaskExecutionPrompt,
    llm_factory=llm_factory,
)

# 5. 运行
async def main():
    env = create_environment(task)  # 创建执行环境
    result = await runner.run(env, tools_factory)
    print(f"Result: reward={result.total_reward}, steps={result.steps}")

asyncio.run(main())
```

## 目录结构

```
orchestra_core/
├── __init__.py           # 模块入口
├── interfaces.py         # 核心接口定义
├── config.py             # 配置管理
├── main_agent.py         # MainAgent 实现
├── sub_agent.py          # SubAgent 实现
├── runner.py             # OrchestraRunner 实现
├── sub_runner.py         # SubAgentRunner 实现
├── trace_formatter.py    # 轨迹格式化
├── tools/
│   ├── __init__.py
│   ├── delegate.py       # 委派工具
│   └── submit.py         # 提交工具
└── prompts/
    ├── __init__.py
    ├── base.py           # 基础 Prompt 构建器
    ├── task_execution.py # 任务执行类 Prompt
    └── question_answering.py  # 问答类 Prompt
```

## 设计原则

1. **关注点分离**: MainAgent 负责决策，SubAgent 负责执行
2. **可扩展性**: 通过接口抽象支持不同的 LLM、环境、工具
3. **模型无关**: 支持任意 LLM 后端
4. **执行隔离**: SubAgent 在隔离环境中运行
5. **可观测性**: 完整的执行轨迹记录
