#!/usr/bin/env python3
"""
图片集中程序
将指定目录下各子目录中samples文件夹内的图片集中到一个新目录中
"""

import os
import shutil
from pathlib import Path
import sys

def concentrate_images(source_dir, output_prefix="concentrate_"):
    """
    将源目录下各子目录的samples文件夹内的图片集中到新目录
    
    Args:
        source_dir (str): 源目录路径
        output_prefix (str): 输出目录前缀
    
    Returns:
        tuple: (成功复制的文件数量, 失败的文件数量, 输出目录路径)
    """
    source_path = Path(source_dir)
    
    # 检查源目录是否存在
    if not source_path.exists():
        print(f"错误：源目录不存在 - {source_dir}")
        return 0, 0, None
    
    # 创建输出目录名称
    source_dir_name = source_path.name
    parent_dir = source_path.parent
    output_dir_name = f"{output_prefix}{source_dir_name}"
    output_dir = parent_dir / output_dir_name
    
    # 创建输出目录
    output_dir.mkdir(exist_ok=True)
    
    print(f"源目录: {source_dir}")
    print(f"输出目录: {output_dir}")
    print("开始处理...")
    
    success_count = 0
    failure_count = 0
    processed_subdirs = 0
    
    # 遍历源目录下的所有子目录
    for subdir in sorted(source_path.iterdir()):
        if not subdir.is_dir():
            continue
            
        samples_dir = subdir / "samples"
        
        # 检查是否存在samples文件夹
        if not samples_dir.exists():
            print(f"跳过 {subdir.name}: 未找到samples文件夹")
            continue
            
        print(f"处理子目录: {subdir.name}")
        processed_subdirs += 1
        
        # 遍历samples目录中的所有图片文件
        for image_file in samples_dir.iterdir():
            if not image_file.is_file():
                continue
                
            # 检查是否为图片文件（基于扩展名）
            image_extensions = {'.png', '.jpg', '.jpeg', '.bmp', '.gif', '.tiff', '.webp'}
            if image_file.suffix.lower() not in image_extensions:
                continue
                
            # 构造新文件名（加上子目录名前缀避免重名）
            new_filename = f"{subdir.name}_{image_file.name}"
            output_file_path = output_dir / new_filename
            
            try:
                # 复制文件
                shutil.copy2(image_file, output_file_path)
                success_count += 1
            except Exception as e:
                print(f"复制失败 {image_file} -> {output_file_path}: {e}")
                failure_count += 1
        
        # 每处理10个子目录显示一次进度
        if processed_subdirs % 10 == 0:
            print(f"已处理 {processed_subdirs} 个子目录...")
    
    print("\n" + "="*50)
    print("处理完成！")
    print(f"处理的子目录数量: {processed_subdirs}")
    print(f"成功复制的图片数量: {success_count}")
    print(f"失败的文件数量: {failure_count}")
    print(f"输出目录: {output_dir}")
    print("="*50)
    
    return success_count, failure_count, str(output_dir)

def main():
    """主函数"""
    # 默认源目录
    default_source_dir = "./runtime/pipeline-cFalse-tFalse-steps64-k12-disa-u100-l100-lin-ord_rand-mask_cos-20250921_140548"
    
    # 如果提供了命令行参数，使用参数作为源目录
    if len(sys.argv) > 1:
        source_dir = sys.argv[1]
    else:
        source_dir = default_source_dir
    
    # 执行图片集中操作
    success_count, failure_count, output_dir = concentrate_images(source_dir)
    
    if output_dir:
        print(f"\n图片已成功集中到: {output_dir}")
        if failure_count > 0:
            print(f"注意：有 {failure_count} 个文件复制失败")
    else:
        print("操作失败！")
        sys.exit(1)

if __name__ == "__main__":
    main()

