To collect data run the following command:

```
python discrete_robots_main.py --agent FB --n-cycles 25 --n-test-rollouts 10 --num-rollouts-per-cycle 2 --update-eps 0.2 --soft-update --temp 200 --seed 0 --gamma 0.99 --lr 0.0001 --polyak 0.95 --embed-dim 100 --w-sampling cauchy_ball --n-epochs 200 --cuda
```

To train PSM run the following command:

```
python discrete_robots_main.py --agent PSM --n-cycles 10000 --n-test-rollouts 10 --update-eps 1 --soft-update --temp 200 --seed 0 --gamma 0.99 --lr 0.0001 --polyak 0.01 --embed-dim 100 --w-sampling cauchy_ball --n-epochs 200 --cuda
```

To train FB, run the following command:

```
python discrete_robots_main.py --agent FB --n-cycles 50 --n-test-rollouts 10 --num-rollouts-per-cycle 4 --update-eps 1 --soft-update --temp 200 --seed 2 --gamma 0.99 --lr 0.0001 --polyak 0.95 --embed-dim 100 --w-sampling cauchy_ball --n-epochs 100 --cuda
```

To train LAPLACE, run the following command:

```
discrete_robots_main.py --agent LAPLACE --n-cycles 50 --n-test-rollouts 10 --num-rollouts-per-cycle 4 --update-eps 1 --soft-update --temp 200 --seed 2 --gamma 0.99 --lr 0.0001 --polyak 0.95 --embed-dim 100 --w-sampling cauchy_ball --n-epochs 100 --cuda
```