# SFT - 代码生成微调

使用Qwen2.5-14B进行电路代码生成的监督微调。

## 文件说明

- `train.py`: 训练脚本
- `inference.py`: 推理脚本
- `config.json`: 配置文件

## 安装依赖

```bash
pip install transformers datasets peft accelerate bitsandbytes torch
```

## 训练

```bash
# 修改train.py中的MODEL_PATH为本地Qwen2.5-14B路径
python SFT/train.py
```

训练数据自动从`data/`文件夹读取JSON文件，对应的ground truth从`bayes/`文件夹读取。

## 推理

```bash
python SFT/inference.py data/circuit_data.json
```

## 配置说明

- **量化**: 使用4bit量化节省显存
- **LoRA**: r=16, alpha=32
- **训练**: 3个epoch, batch_size=1, gradient_accumulation=8
