import os
import shutil
import librosa
import argparse
from tqdm import tqdm

def filter_and_copy_audios(input_dir, output_dir, record_file, max_duration=10.0):
    """
    筛选时长小于等于 max_duration 的音频，并将其复制到新目录。
    同时记录下所有符合条件的音频文件名。
    """
    # 1. 确保输出目录存在
    os.makedirs(output_dir, exist_ok=True)
    
    if not os.path.isdir(input_dir):
        print(f"错误: 输入目录 '{input_dir}' 不存在。")
        return

    short_audio_filenames = []
    
    # 获取所有待处理的文件列表
    file_list = [f for f in os.listdir(input_dir) if f.lower().endswith(('.wav', '.mp3', '.flac'))]
    
    print(f"正在处理目录 '{input_dir}' 中的 {len(file_list)} 个音频文件...")
    
    # 2. 遍历所有音频文件
    for filename in tqdm(file_list, desc="筛选音频"):
        source_path = os.path.join(input_dir, filename)
        
        try:
            # 获取音频时长
            duration = librosa.get_duration(path=source_path)
            
            # 3. 判断时长并执行操作
            if duration <= max_duration:
                # 将文件名添加到列表中
                short_audio_filenames.append(filename)
                
                # 复制文件到输出目录
                destination_path = os.path.join(output_dir, filename)
                shutil.copy2(source_path, destination_path)
                
        except Exception as e:
            print(f"\n处理文件 {filename} 时出错: {e}")

    # 4. 将短音频文件名列表写入文件
    with open(record_file, 'w') as f:
        for name in short_audio_filenames:
            f.write(name + '\n')
            
    print("\n--- 处理完成 ---")
    print(f"共找到 {len(short_audio_filenames)} 个时长小于等于 {max_duration}秒 的音频。")
    print(f"这些文件已复制到: {output_dir}")
    print(f"文件名列表已保存至: {record_file}")


if __name__ == '__main__':
    parser = argparse.ArgumentParser(description="筛选短音频并复制。")
    parser.add_argument('--input_dir', type=str, required=True, help='原始音频文件目录。')
    parser.add_argument('--output_dir', type=str, required=True, help='存放短音频的目标目录。')
    parser.add_argument('--record_file', type=str, default='short_audios.txt', help='记录短音频文件名的文本文件路径。')
    parser.add_argument('--max_duration', type=float, default=10.0, help='音频最大时长（秒）。')
    
    args = parser.parse_args()
    
    filter_and_copy_audios(args.input_dir, args.output_dir, args.record_file, args.max_duration)

"""
python filter_mmau.py \
    --input_dir /data2/wl/test-mini-audios \
    --output_dir /data2/wl/test-mini-audios-short
"""