python main_ner.py --task ner --bag_size 100 --reward_mode shannon_entropy --rl_timesteps 10000 --alg sac