# CLTAG - VOC2012 Classification with RAM++

核心实现：包含 VOC2012 数据集加载器及 RAM++ 推理脚本。

## 🔧 核心文件

### 数据和脚本
- **`voc2012_dataset.py`** - VOC2012数据集加载器，支持多标签分类
- **`inference_ram_plus_clean.py`** - 清理后的推理脚本，支持批量处理

## 🚀 快速开始

### 推理
```bash
python inference_ram_plus_clean.py \
    --model-type original \
    --pretrained ./pretrained/ram_plus_swin_large_14m.pth \
    --image /path/to/image.jpg \
    --device cuda:1
```

## 📊 VOC2012 类别

20个PASCAL VOC对象类别：
```
aeroplane, bicycle, bird, boat, bottle, bus, car, cat, chair, cow,
diningtable, dog, horse, motorbike, person, pottedplant, sheep, sofa, train, tvmonitor
```

## ⚙️ 关键特性

- **参数冻结**: 99.6%参数冻结，仅训练分类头（404K参数）
- **多标签**: 支持一张图像包含多个类别
- **批量推理**: 高效的DataLoader批处理
- **灵活设备**: 支持指定GPU卡（cuda:0, cuda:1等）
- **AsymmetricLoss**: 处理类别不平衡问题

## 🎯 主要用途

1. **OOD评估**: 评估RAM++在域外数据上的表现
2. **快速适配**: 基于数据加载器自行编写训练/评估脚本

简洁、高效、专注核心功能。
