num_iter : 2000
mdp_name : Baird
gamma : 0.99
alpha : 0.05
beta : 0.25
agent : "GreedyGQ"
eta : 2
exp : 8645a
normalize : True