#/bin/bash
#python benchmark_selfplay_s2b.py \
python -m ipdb -c c benchmark_selfplay_s2b.py \
--use_cuda=True --seed=10 --yaml_config=s2b_descr+feedback_comp_foc_1shot_r2d2_dc_esbn_benchmark_config.yaml \
--descriptive=True --max_nbr_values_per_latent=4 --min_nbr_values_per_latent=2 --sampling_strategy=component-focused-2shots \
--nbr_distractors=0 --nbr_latents=2 --nbr_object_centric_samples=1 --provide_listener_feedback=True \
--nbr_episode_per_cycle=32 --nbr_training_iteration_per_cycle=4 \
--nbr_minibatches=4 --batch_size=128 --learning_rate=6.25e-05 --critic_arch_feature_dim=256 \
--tau=0.0004 --n_step=7 --nbr_actor=32 --replay_capacity=1e4 --min_capacity=1e3 \
--sequence_replay_burn_in_ratio=0.5 --sequence_replay_unroll_length=40 \
--r2d2_use_value_function_rescaling=False \
--use_rule_based_agent=True --use_speaker_rule_based_agent=True \
--listener_comm_rec=True --listener_multimodal_rec_biasing=True --listener_rec=True \
--listener_rec_period=10 --rec_threshold=0.02 \
--train_observation_budget=1.0e7 

