"""
多仓库筛选示例
==============

演示如何使用 FilterAndRankRepos 对多个仓库进行筛选和排序。
"""

import sys
from pathlib import Path

sys.path.insert(0, str(Path(__file__).parent.parent))

from repo_analysis import FilterAndRankRepos
from repo_analysis.multi_repo_filter import print_ranking_results


def main():
    print("=" * 80)
    print("多仓库筛选和排序示例")
    print("=" * 80)
    
    # 定义任务
    task_description = """
    实现一个用于Kaggle竞赛的机器学习解决方案。
    需要包含：
    - 数据预处理和特征工程
    - 模型训练 (XGBoost或LightGBM)
    - 交叉验证
    - 超参数优化
    """
    
    print(f"\n任务描述:\n{task_description}\n")
    
    # 仓库列表 (替换为实际路径)
    repo_paths = [
        '/path/to/repo1',
        '/path/to/repo2',
        '/path/to/repo3',
        '/path/to/repo4',
        '/path/to/repo5',
    ]
    
    print(f"待分析仓库数量: {len(repo_paths)}\n")
    
    # 创建筛选器
    filter_ranker = FilterAndRankRepos(
        llm_client=None,  # 不使用LLM
        max_workers=4,  # 并行处理4个仓库
        max_tokens_per_repo=3000
    )
    
    # 执行筛选和排序
    print("开始分析和排序...\n")
    top_repos = filter_ranker.filter_and_rank(
        task=task_description,
        repo_paths=repo_paths,
        top_k=3,  # 返回前3名
        use_llm=False  # 使用启发式评分
    )
    
    # 打印结果
    print_ranking_results(top_repos)
    
    # 保存结果
    output_file = 'ranked_repos.json'
    filter_ranker.save_results(
        results=top_repos,
        output_file=output_file,
        include_full_context=False
    )
    
    print(f"\n结果已保存到: {output_file}")


if __name__ == '__main__':
    main()

