python train_logging_policy.py --config config/fmnist/supervised.yaml --device cuda:1 --tau 0.2 --dataset fmnist --linear --raw_image --propensiy_estimation