# 工具设计模式对比

## 🎯 两种设计模式

### 模式1: 单工具多动作 (fileagent_stateful_tool.py)

```python
class FileAgentSandboxTool(BaseTool):
    """一个工具，多个action"""
    
    async def execute(self, instance_id: str, parameters: dict, **kwargs):
        match parameters["action"]:
            case "WriteFile":
                return sandbox_write_file(...)
            case "ExecuteCommand":
                return sandbox_execute_command(...)
```

**工具调用示例**:
```json
{
  "name": "FileAgentSandboxTool",
  "arguments": {
    "action": "WriteFile",
    "filename": "test.py",
    "content": "print('hello')"
  }
}
```

### 模式2: 多工具分离 (fileagent_sandbox_tool.py)

```python
class FileagentExecuteCodeTool(BaseTool):
    """专门执行代码"""
    async def execute(self, instance_id: str, parameters: dict, **kwargs):
        return run_code(parameters["code"], ...)

class FileagentExecuteShellTool(BaseTool):
    """专门执行Shell命令"""
    async def execute(self, instance_id: str, parameters: dict, **kwargs):
        return sandbox_execute_command(parameters["command"], ...)
```

**工具调用示例**:
```json
{
  "name": "ExecuteCode",
  "arguments": {
    "code": "print('hello')"
  }
}
```

---

## 📊 详细对比

| 维度 | 单工具多动作 | 多工具分离 |
|------|-------------|-----------|
| **职责划分** | 一个类处理多个操作 | 每个类一个职责 |
| **代码复杂度** | 需要action分发逻辑 | 简单直接 |
| **配置数量** | 1个工具配置 | N个工具配置 |
| **沙盒管理** | 天然共享 | 需要额外实现共享 |
| **模型理解** | 需要学action参数 | 直接函数名 |
| **OpenAI标准** | 不标准 | 标准 |
| **参数验证** | 复杂（多种action） | 简单（固定schema） |
| **错误处理** | 集中处理 | 分散处理 |

---

## 🤔 选择哪种模式？

### 选择 **单工具多动作** 如果：

✅ **操作之间有强关联**
- 例如：先WriteFile，再ExecuteCommand
- 需要共享状态和环境

✅ **工具数量会很多**
- 避免工具列表过长
- 简化工具注册

✅ **自定义协议**
- 不需要遵循OpenAI标准
- 有自己的工具调用格式

### 选择 **多工具分离** 如果：

✅ **遵循OpenAI标准**
- 使用标准的Function Calling
- 模型已在OpenAI格式上训练

✅ **工具职责独立**
- 每个工具可以独立使用
- 不需要复杂的状态共享

✅ **更好的可读性**
- 代码更清晰
- 每个工具文件独立维护

---

## 💡 混合方案：独立工具 + 共享沙盒

**最佳实践**: 保持工具分离，但通过全局注册表共享沙盒

```python
# 全局沙盒管理器
_SHARED_SANDBOX_REGISTRY = {}

class FileagentExecuteCodeTool(BaseTool):
    async def create(self, instance_id, **kwargs):
        # 检查是否已有共享沙盒
        if instance_id in _SHARED_SANDBOX_REGISTRY:
            self._session_ids[instance_id] = _SHARED_SANDBOX_REGISTRY[instance_id]
            return instance_id, ToolResponse(text="Reusing shared sandbox")
        
        # 创建新沙盒并注册
        response = create_sandbox()
        session_id = json.loads(response.result)["session_id"]
        _SHARED_SANDBOX_REGISTRY[instance_id] = session_id
        self._session_ids[instance_id] = session_id
        return instance_id, ToolResponse(text="Created new sandbox")
```

这样可以获得：
- ✅ 清晰的工具接口
- ✅ 共享的沙盒环境
- ✅ 独立的职责划分

---

## 🎓 实际案例

### OpenAI GPT 工具调用

```json
{
  "tools": [
    {"type": "function", "function": {"name": "get_weather", ...}},
    {"type": "function", "function": {"name": "search_web", ...}}
  ]
}
```

**采用**: 多工具分离 ✅

### LangChain Tools

```python
class CalculatorTool(BaseTool):
    name = "calculator"
    
class SearchTool(BaseTool):
    name = "search"
```

**采用**: 多工具分离 ✅

### Anthropic Claude Tools

```json
{
  "name": "bash",
  "type": "bash_20241022",
  ...
}
```

**采用**: 多工具分离 ✅

---

## 📌 当前实现建议

**你的 `fileagent_sandbox_tool.py` 采用"多工具分离"是正确的选择！**

原因：
1. ✅ 符合OpenAI Function Calling标准
2. ✅ 模型训练数据通常基于这种格式
3. ✅ 更容易被模型理解和使用
4. ✅ 代码清晰，易于维护

**但需要解决的问题**：
- ❌ 234次工具调用全部失败（JSON格式错误）
- ❌ 需要改进模型的工具调用能力
- ⚠️  可以考虑添加沙盒共享机制

---

## 🔧 下一步优化

1. **修复JSON格式问题**
   - 改进SFT训练数据质量
   - 确保所有tool call示例都是正确的JSON

2. **添加沙盒共享**
   - 实现全局注册表
   - ExecuteCode和ExecuteShell可以共享沙盒

3. **增强日志**
   - 添加更详细的工具执行日志
   - 便于调试工具调用问题

---

最后更新: 2025-10-17

