python3 benchmark.py \
 --mas autogen \
 --suite benign \
 --defense safety_filter \
 --task_domain code \
 --max_workers 8 \