import os
import re
import json
import time
import requests
from concurrent.futures import ThreadPoolExecutor, as_completed
import threading

# ================= 配置区域 =================
# ⚠️ 这里填你的 Key
API_KEY = ""
# 你的完整 JSON 文件路径
INPUT_FILE = r"patterns_merged_improved.json"
# 输出目录
OUTPUT_DIR =r"codennewgen"

ENDPOINT = "https://api.deepseek.com/v1/chat/completions"
MODEL = "deepseek-reasoner"

# ⚠️ 严格限流配置 (针对 60 RPM)
MAX_WORKERS = 4          # 线程数
REQUEST_INTERVAL = 3.0   # 每次请求强制间隔 1.2 秒
# ===========================================

# 全局锁，用于控制请求频率
rate_lock = threading.Lock()
last_req_time = 0

def wait_for_slot():
    """精确控制请求间隔，防止 429"""
    global last_req_time
    with rate_lock:
        now = time.time()
        diff = now - last_req_time
        if diff < REQUEST_INTERVAL:
            time.sleep(REQUEST_INTERVAL - diff)
        last_req_time = time.time()

def sanitize_filename(text):
    """将中文名称转换为合法的文件名"""
    # 保留中文、字母、数字、下划线
    text = re.sub(r'[^\w\u4e00-\u9fa5-]', '_', text)
    return text.strip('_')[:50] # 限制长度防止文件名过长

def generate_code_for_pattern(pattern, index):
    """核心生成逻辑"""
    
    # 1. 构造唯一的函数名和文件名 (解决 ID 重复问题)
    p_id = pattern.get('id', 'unk')
    p_name = pattern.get('name', 'untitled')
    # 格式: P001_0_ANSI转义序列重复
    unique_name = f"{p_id}_{index}_{sanitize_filename(p_name)}"
    func_name = f"generate_{unique_name}"
    file_path = os.path.join(OUTPUT_DIR, f"{unique_name}.py")

    # 如果文件已存在，跳过
    if os.path.exists(file_path):
        return f"⏭️ 跳过 (已存在): {unique_name}"

    # 2. 构建 Prompt
    # 直接把你的 JSON 结构喂给 AI，它能理解 fields 和 length_control
    prompt = f"""
你是一个 Python代码生成专家。请为下面的数据模式编写一个 Python 生成函数。

【需求详情】
1. 函数名: `{func_name}`
2. 必须导入必要的库 (random, string 等)。
3. **字段规则 (Fields)**: 必须严格根据 `fields` 列表中的 `values_or_rules` 和 `type` 生成数据。
4. **模板结构 (Template)**: 生成的字符串必须符合 `template` 的格式。
5. **长度控制 (Length Control)**: 必须实现循环逻辑，通过重复生成单元，使最终输出字符串的长度近似满足 `target_tokens` (假设 1 token ≈ 4 字符)。
6. **输出**: 只返回 Python 代码，不要 Markdown 标记。

【模式定义 JSON】
{json.dumps(pattern, ensure_ascii=False, indent=2)}
"""

    # 3. 发送请求 (带重试和限流)
    messages = [
        {"role": "system", "content": "你是一个严谨的 Python 开发者。只输出代码，不输出解释。"},
        {"role": "user", "content": prompt}
    ]

    headers = {
        "Authorization": f"Bearer {API_KEY}",
        "Content-Type": "application/json"
    }
    
    for attempt in range(3):
        wait_for_slot() # <--- 关键：排队发请求
        try:
            resp = requests.post(
                ENDPOINT, 
                json={"model": MODEL, "messages": messages, "temperature": 0.0, "max_tokens": 1600},
                headers=headers,
                timeout=60
            )
            
            if resp.status_code == 200:
                content = resp.json()['choices'][0]['message']['content']
                # 清洗 Markdown
                code = re.sub(r'^```python\s*', '', content)
                code = re.sub(r'^```\s*', '', code)
                code = re.sub(r'```$', '', code)
                
                # 保存文件
                with open(file_path, 'w', encoding='utf-8') as f:
                    f.write(f"# ID: {p_id} | Name: {p_name}\n")
                    f.write(code)
                return f"✅ 成功: {unique_name}"
            
            elif resp.status_code == 429:
                print(f"⚠️ 限流等待中... ({unique_name})")
                time.sleep(5)
            else:
                print(f"❌ API 错误 {resp.status_code}: {resp.text[:100]}")
                
        except Exception as e:
            print(f"❌ 网络异常: {e}")
            time.sleep(1)

    return f"❌ 失败 (重试耗尽): {unique_name}"

def main():
    if not os.path.exists(OUTPUT_DIR):
        os.makedirs(OUTPUT_DIR)

    # 读取文件
    try:
        with open(INPUT_FILE, 'r', encoding='utf-8') as f:
            data = json.load(f)
            # 兼容处理：如果根是 list 直接用，如果是 dict 取 patterns
            patterns = data if isinstance(data, list) else data.get("patterns", [])
    except Exception as e:
        print(f"无法读取 JSON 文件: {e}")
        return

    print(f"📦 准备处理 {len(patterns)} 个 Pattern...")

    # 多线程执行
    with ThreadPoolExecutor(max_workers=MAX_WORKERS) as executor:
        # 注意：这里我们传入 enumerate 的 index，用于解决 ID 重复问题
        futures = [executor.submit(generate_code_for_pattern, p, idx) for idx, p in enumerate(patterns)]
        
        for future in as_completed(futures):
            print(future.result())

    print("\n🎉 所有任务处理完毕。请查看 generated_functions 目录。")

# 引入 threading 模块 (上面漏了)
import threading

if __name__ == "__main__":
    main()