#!/usr/bin/env python3
"""
快速初始化 Kaggle 知识检索系统
"""

import subprocess
import sys
from pathlib import Path

def check_dependencies():
    """检查必要的依赖是否已安装"""
    required = ["sentence_transformers", "faiss", "torch"]
    missing = []
    
    for pkg in required:
        try:
            __import__(pkg.replace("-", "_"))
        except ImportError:
            missing.append(pkg)
    
    if missing:
        print(f"⚠️  缺少依赖: {', '.join(missing)}")
        print("\n请运行以下命令安装:")
        print(f"  pip install {' '.join(missing)}")
        return False
    
    return True

def init_corpus():
    """初始化 Kaggle 语料库"""
    print("📚 正在初始化 Kaggle 语料库...")
    subprocess.run([sys.executable, "manage_kaggle_kb.py", "init"])
    print("✅ 语料库初始化完成\n")

def show_stats():
    """显示语料库统计"""
    print("📊 语料库统计信息:")
    subprocess.run([sys.executable, "manage_kaggle_kb.py", "stats"])
    print()

def run_test():
    """运行测试"""
    print("🧪 运行检索测试...\n")
    subprocess.run([sys.executable, "test_kaggle_retrieval.py"])

def main():
    print("=" * 70)
    print("  Kaggle 知识检索系统 - 快速启动")
    print("=" * 70)
    print()
    
    # 1. 检查依赖
    print("[1/4] 检查依赖...")
    if not check_dependencies():
        sys.exit(1)
    print("✅ 依赖已就绪\n")
    
    # 2. 初始化语料库
    print("[2/4] 初始化语料库...")
    init_corpus()
    
    # 3. 显示统计
    print("[3/4] 查看统计信息...")
    show_stats()
    
    # 4. 运行测试
    print("[4/4] 运行测试...")
    response = input("是否运行完整测试？(需要 LLM API，可能需要几分钟) [y/N]: ")
    if response.lower() == 'y':
        run_test()
    else:
        print("⏭️  跳过测试\n")
    
    # 完成提示
    print("=" * 70)
    print("✅ 初始化完成！")
    print("=" * 70)
    print("\n下一步:")
    print("  1. 在 config.json 中设置 'enable_kaggle_retrieval': true")
    print("  2. 运行主程序时会自动检索 Kaggle 知识")
    print("  3. 查看 KAGGLE_EXAMPLES.md 了解更多用法")
    print()

if __name__ == "__main__":
    main()
