# FileAgent Sandbox Tool 迁移说明

## 📋 变更内容

### 1. 文件位置迁移
- **旧位置**: `/path/to/project/verl/verl/tools/fileagent_sandbox_tool.py`
- **新位置**: `/path/to/project/verl/recipe/fileagent/tools/fileagent_sandbox_tool.py`

### 2. 接口简化
新版本与 `fileagent_stateful_tool.py` 接口对齐：

#### create() 方法
```python
async def create(
    instance_id: Optional[str] = None,
    files: list[FILE] = [],  # 新增：预写入文件列表
    **kwargs
) -> tuple[str, ToolResponse]
```

#### execute() 方法
```python
async def execute(
    instance_id: str, 
    parameters: dict[str, Any],
    **kwargs
) -> tuple[ToolResponse, float, dict]
```

返回格式统一为：`ToolResponse(text=json.dumps(response.as_dict()))`

#### release() 方法
```python
async def release(instance_id: str, **kwargs) -> None
```

### 3. 移除的功能
- ❌ 全局沙盒注册表 (`_GLOBAL_SANDBOX_REGISTRY`)
- ❌ 复杂的引用计数机制
- ❌ 延迟销毁策略
- ❌ 自定义 reward 计算逻辑
- ❌ 执行历史追踪

### 4. 保留的功能
- ✅ ExecuteCode 工具 - 执行Python代码
- ✅ ExecuteShell 工具 - 执行Shell命令
- ✅ 沙盒生命周期管理
- ✅ 文件预写入功能
- ✅ 错误处理和日志记录

## 🔧 配置文件更新

**文件**: `recipe/fileagent/config/tool/extracted_bench_tool.yaml`

```yaml
# 旧配置
- class_name: "verl.tools.fileagent_sandbox_tool.FileagentExecuteCodeTool"
- class_name: "verl.tools.fileagent_sandbox_tool.FileagentExecuteShellTool"

# 新配置
- class_name: "recipe.fileagent.tools.fileagent_sandbox_tool.FileagentExecuteCodeTool"
- class_name: "recipe.fileagent.tools.fileagent_sandbox_tool.FileagentExecuteShellTool"
```

## 📝 使用示例

### 创建工具实例（带预置文件）
```python
files = [
    ("data.csv", b"col1,col2\n1,2\n3,4"),
    ("script.py", b"import pandas as pd\nprint('Hello')")
]

instance_id, response = await tool.create(files=files)
```

### 执行代码
```python
response, reward, metrics = await tool.execute(
    instance_id,
    {"code": "import pandas as pd\ndf = pd.read_csv('data.csv')\nprint(df)"}
)
```

### 执行Shell命令
```python
response, reward, metrics = await tool.execute(
    instance_id,
    {"command": "ls -la"}
)
```

### 释放资源
```python
await tool.release(instance_id)
```

## 🎯 设计理念

### 旧版本（复杂）
- 全局沙盒注册表
- 引用计数机制
- 延迟销毁
- 自定义reward计算
- **问题**: 过度设计，难以维护

### 新版本（简洁）
- 每个工具独立管理沙盒
- 简单的 create-execute-release 生命周期
- 统一的返回格式
- **优势**: 接口清晰，易于理解和维护

## ⚠️ 注意事项

1. **沙盒隔离**: 每个 instance_id 对应一个独立的沙盒
2. **资源清理**: 务必在使用完成后调用 `release()` 
3. **返回格式**: 所有响应都是 JSON 字符串格式
4. **错误处理**: 执行失败时返回包含错误信息的JSON

## 🚀 后续优化方向

1. 如需沙盒复用，可以在上层实现连接池
2. 如需自定义reward，建议在外部reward函数中实现
3. 如需更复杂的状态管理，可以考虑使用状态管理器

---

最后更新: 2025-10-17

