python main.py --env Multigoal --max_experiment_steps 5e5 --seed 33 --actor svgd_nonparam --train_action_selection random --test_action_selection softmax --gpu_id 1 --svgd_steps 10 --a_c 0.2 --a_a 0.2