import wandb
import time
from wandb.apis.public import Api

# --- 1. 定义源 Run 和目标项目 ---
SOURCE_ENTITY = "astrid_tuning_llm"        # 你的用户名或团队名
SOURCE_PROJECT = "verl-qwen3-4b-base"  # 源项目名
SOURCE_RUN_ID = "dye4avkn"         # 你想复制的 Run 的 ID

DESTINATION_PROJECT = "verl-qwen3-4b-oct" # 新 Run 所在的项目

# --- 2. 使用 API 获取源 Run 的配置 ---
api = Api()
try:
    source_run_path = f"{SOURCE_ENTITY}/{SOURCE_PROJECT}/{SOURCE_RUN_ID}"
    source_run = api.run(source_run_path)

    # 获取配置和最终总结
    source_config = source_run.config
    source_summary = source_run.summary

    # 获取所有历史记录为一个 pandas DataFrame
    history_df = source_run.history()
    print(f"成功获取源 Run '{source_run.name}' 的所有数据。共 {len(history_df)} 条历史记录。")

except Exception as e:
    print(f"获取源 Run 失败: {e}")
    exit()

# --- 3. 初始化一个新 Run 并写入数据 ---
new_run = wandb.init(
    project=DESTINATION_PROJECT,
    config=source_config,
)
new_run.name = f"copy-of-{source_run.name}" # 给新 run 一个有意义的名字

print(f"创建新 Run: {new_run.name}")

# --- 4. 重新记录每一条历史数据 ---
# 遍历 DataFrame 的每一行，每一行代表一次 wandb.log 操作
for index, row in history_df.iterrows():
    # 将 Series 转换为字典，并去除空值
    log_dict = row.dropna().to_dict()
    # 提取 '_step' 作为记录的步数，如果没有则 wandb 会自动递增
    step = log_dict.pop('_step', None)
    # 将 step 转换为整数类型
    if step is not None:
        step = int(step)
    # 移除其他 wandb 内部字段
    log_dict.pop('_runtime', None)
    log_dict.pop('_timestamp', None)
    
    if log_dict: # 确保字典不为空
        new_run.log(log_dict, step=step)

# --- 5. 更新最终的 summary ---
# wandb 会根据 log 自动更新 summary，但我们也可以手动覆盖确保一致
new_run.summary.update(source_summary)

# 结束 Run
new_run.finish()

print(f"数据复制完成！新 Run 的链接: {new_run.url.replace('/api/', '/')}") # 修正URL格式

# --- 4. 在这里运行你的实验代码 ---
# 例如，你的模型训练代码会使用 wandb.config 中的所有超参数
# for epoch in range(wandb.config.epochs):
#     loss = ... # 你的训练逻辑
#     accuracy = ...
#     wandb.log({"loss": loss, "accuracy": accuracy})
#     time.sleep(1) # 模拟训练过程

# 结束新的 Run
