python -u generate_dataset.py --num-train 10000 --seed 43 --sufix small