--cuda
--env_name=FrankaCubeStack
--logdir=logs
--logdir_suffix=tmp
--num_envs=100
--num_humans=10
--num_players=2
--num_steps=10005
--min_int_time=5
--hard_reset_time=5
--supervisor=Analytic
--order=CUR
--risk_thresh=0.5
--no_pretrain_qrisk
--uncertainty_thresh=0.075
--batch_size=512
--updates_per_step=2
--num_unsafe_transitions=20000
--policy_pretraining_steps=1000
--pos_fraction=0.25
--log_freq=1000
--free_humans
--num_task_transitions=5000
--vec_env
