python convlab/policy/gdpl/train.py --seed=0 --action_mask=1
python convlab/policy/gdpl/train.py --seed=1 --action_mask=1
python convlab/policy/gdpl/train.py --seed=2 --action_mask=1
sudo shutdown -h now