python main.py --architecture="mos" --cluster-run --cluster-run-name="mos_test" --cuda --data="data/domain_test" --dropout=0.2 --emsize=200 --lang-switch=10000 --learn-iterations=2 --log-dir="logs" --lr=0.0005 --model-level="word" --nhid=4750 --nlayers=2 --nsoftmaxes=2 --seed=0 --total-length=1000000
python main.py --architecture="mos" --cluster-run --cluster-run-name="mos_test" --cuda --data="data/domain_test" --dropout=0.2 --emsize=200 --lang-switch=10000 --learn-iterations=2 --log-dir="logs" --lr=0.0005 --model-level="word" --nhid=4750 --nlayers=2 --nsoftmaxes=2 --seed=1 --total-length=1000000
python main.py --architecture="mos" --cluster-run --cluster-run-name="mos_test" --cuda --data="data/domain_test" --dropout=0.2 --emsize=200 --lang-switch=10000 --learn-iterations=2 --log-dir="logs" --lr=0.0005 --model-level="word" --nhid=4750 --nlayers=2 --nsoftmaxes=2 --seed=2 --total-length=1000000
python main.py --architecture="mos" --cluster-run --cluster-run-name="mos_test" --cuda --data="data/domain_test" --dropout=0.2 --emsize=200 --lang-switch=10000 --learn-iterations=2 --log-dir="logs" --lr=0.0005 --model-level="word" --nhid=4750 --nlayers=2 --nsoftmaxes=2 --seed=3 --total-length=1000000
python main.py --architecture="mos" --cluster-run --cluster-run-name="mos_test" --cuda --data="data/domain_test" --dropout=0.2 --emsize=200 --lang-switch=10000 --learn-iterations=2 --log-dir="logs" --lr=0.0005 --model-level="word" --nhid=4750 --nlayers=2 --nsoftmaxes=2 --seed=4 --total-length=1000000
python main.py --architecture="mos" --cluster-run --cluster-run-name="mos_test" --cuda --data="data/domain_test" --dropout=0.2 --emsize=200 --lang-switch=10000 --learn-iterations=2 --log-dir="logs" --lr=0.0005 --model-level="word" --nhid=4750 --nlayers=2 --nsoftmaxes=2 --seed=5 --total-length=1000000
python main.py --architecture="mos" --cluster-run --cluster-run-name="mos_test" --cuda --data="data/domain_test" --dropout=0.2 --emsize=200 --lang-switch=10000 --learn-iterations=2 --log-dir="logs" --lr=0.0005 --model-level="word" --nhid=4750 --nlayers=2 --nsoftmaxes=2 --seed=6 --total-length=1000000
python main.py --architecture="mos" --cluster-run --cluster-run-name="mos_test" --cuda --data="data/domain_test" --dropout=0.2 --emsize=200 --lang-switch=10000 --learn-iterations=2 --log-dir="logs" --lr=0.0005 --model-level="word" --nhid=4750 --nlayers=2 --nsoftmaxes=2 --seed=7 --total-length=1000000
python main.py --architecture="mos" --cluster-run --cluster-run-name="mos_test" --cuda --data="data/domain_test" --dropout=0.2 --emsize=200 --lang-switch=10000 --learn-iterations=2 --log-dir="logs" --lr=0.0005 --model-level="word" --nhid=4750 --nlayers=2 --nsoftmaxes=2 --seed=8 --total-length=1000000
python main.py --architecture="mos" --cluster-run --cluster-run-name="mos_test" --cuda --data="data/domain_test" --dropout=0.2 --emsize=200 --lang-switch=10000 --learn-iterations=2 --log-dir="logs" --lr=0.0005 --model-level="word" --nhid=4750 --nlayers=2 --nsoftmaxes=2 --seed=9 --total-length=1000000
python main.py --architecture="mos" --cluster-run --cluster-run-name="mos_test" --cuda --data="data/domain_test" --dropout=0.2 --emsize=200 --lang-switch=20000 --learn-iterations=2 --log-dir="logs" --lr=0.0005 --model-level="word" --nhid=4750 --nlayers=2 --nsoftmaxes=2 --seed=0 --total-length=2000000
python main.py --architecture="mos" --cluster-run --cluster-run-name="mos_test" --cuda --data="data/domain_test" --dropout=0.2 --emsize=200 --lang-switch=20000 --learn-iterations=2 --log-dir="logs" --lr=0.0005 --model-level="word" --nhid=4750 --nlayers=2 --nsoftmaxes=2 --seed=1 --total-length=2000000
python main.py --architecture="mos" --cluster-run --cluster-run-name="mos_test" --cuda --data="data/domain_test" --dropout=0.2 --emsize=200 --lang-switch=20000 --learn-iterations=2 --log-dir="logs" --lr=0.0005 --model-level="word" --nhid=4750 --nlayers=2 --nsoftmaxes=2 --seed=2 --total-length=2000000
python main.py --architecture="mos" --cluster-run --cluster-run-name="mos_test" --cuda --data="data/domain_test" --dropout=0.2 --emsize=200 --lang-switch=20000 --learn-iterations=2 --log-dir="logs" --lr=0.0005 --model-level="word" --nhid=4750 --nlayers=2 --nsoftmaxes=2 --seed=3 --total-length=2000000
python main.py --architecture="mos" --cluster-run --cluster-run-name="mos_test" --cuda --data="data/domain_test" --dropout=0.2 --emsize=200 --lang-switch=20000 --learn-iterations=2 --log-dir="logs" --lr=0.0005 --model-level="word" --nhid=4750 --nlayers=2 --nsoftmaxes=2 --seed=4 --total-length=2000000
python main.py --architecture="mos" --cluster-run --cluster-run-name="mos_test" --cuda --data="data/domain_test" --dropout=0.2 --emsize=200 --lang-switch=20000 --learn-iterations=2 --log-dir="logs" --lr=0.0005 --model-level="word" --nhid=4750 --nlayers=2 --nsoftmaxes=2 --seed=5 --total-length=2000000
python main.py --architecture="mos" --cluster-run --cluster-run-name="mos_test" --cuda --data="data/domain_test" --dropout=0.2 --emsize=200 --lang-switch=20000 --learn-iterations=2 --log-dir="logs" --lr=0.0005 --model-level="word" --nhid=4750 --nlayers=2 --nsoftmaxes=2 --seed=6 --total-length=2000000
python main.py --architecture="mos" --cluster-run --cluster-run-name="mos_test" --cuda --data="data/domain_test" --dropout=0.2 --emsize=200 --lang-switch=20000 --learn-iterations=2 --log-dir="logs" --lr=0.0005 --model-level="word" --nhid=4750 --nlayers=2 --nsoftmaxes=2 --seed=7 --total-length=2000000
python main.py --architecture="mos" --cluster-run --cluster-run-name="mos_test" --cuda --data="data/domain_test" --dropout=0.2 --emsize=200 --lang-switch=20000 --learn-iterations=2 --log-dir="logs" --lr=0.0005 --model-level="word" --nhid=4750 --nlayers=2 --nsoftmaxes=2 --seed=8 --total-length=2000000
python main.py --architecture="mos" --cluster-run --cluster-run-name="mos_test" --cuda --data="data/domain_test" --dropout=0.2 --emsize=200 --lang-switch=20000 --learn-iterations=2 --log-dir="logs" --lr=0.0005 --model-level="word" --nhid=4750 --nlayers=2 --nsoftmaxes=2 --seed=9 --total-length=2000000
python main.py --architecture="mos" --cluster-run --cluster-run-name="mos_test" --cuda --data="data/news_test" --dropout=0.2 --emsize=200 --lang-switch=100000 --learn-iterations=2 --log-dir="logs" --lr=0.001 --model-level="char" --nhid=500 --nlayers=2 --nsoftmaxes=75 --seed=0 --total-length=10000000
python main.py --architecture="mos" --cluster-run --cluster-run-name="mos_test" --cuda --data="data/news_test" --dropout=0.2 --emsize=200 --lang-switch=100000 --learn-iterations=2 --log-dir="logs" --lr=0.001 --model-level="char" --nhid=500 --nlayers=2 --nsoftmaxes=75 --seed=1 --total-length=10000000
python main.py --architecture="mos" --cluster-run --cluster-run-name="mos_test" --cuda --data="data/news_test" --dropout=0.2 --emsize=200 --lang-switch=100000 --learn-iterations=2 --log-dir="logs" --lr=0.001 --model-level="char" --nhid=500 --nlayers=2 --nsoftmaxes=75 --seed=2 --total-length=10000000
python main.py --architecture="mos" --cluster-run --cluster-run-name="mos_test" --cuda --data="data/news_test" --dropout=0.2 --emsize=200 --lang-switch=100000 --learn-iterations=2 --log-dir="logs" --lr=0.001 --model-level="char" --nhid=500 --nlayers=2 --nsoftmaxes=75 --seed=3 --total-length=10000000
python main.py --architecture="mos" --cluster-run --cluster-run-name="mos_test" --cuda --data="data/news_test" --dropout=0.2 --emsize=200 --lang-switch=100000 --learn-iterations=2 --log-dir="logs" --lr=0.001 --model-level="char" --nhid=500 --nlayers=2 --nsoftmaxes=75 --seed=4 --total-length=10000000
python main.py --architecture="mos" --cluster-run --cluster-run-name="mos_test" --cuda --data="data/news_test" --dropout=0.2 --emsize=200 --lang-switch=100000 --learn-iterations=2 --log-dir="logs" --lr=0.001 --model-level="char" --nhid=500 --nlayers=2 --nsoftmaxes=75 --seed=5 --total-length=10000000
python main.py --architecture="mos" --cluster-run --cluster-run-name="mos_test" --cuda --data="data/news_test" --dropout=0.2 --emsize=200 --lang-switch=100000 --learn-iterations=2 --log-dir="logs" --lr=0.001 --model-level="char" --nhid=500 --nlayers=2 --nsoftmaxes=75 --seed=6 --total-length=10000000
python main.py --architecture="mos" --cluster-run --cluster-run-name="mos_test" --cuda --data="data/news_test" --dropout=0.2 --emsize=200 --lang-switch=100000 --learn-iterations=2 --log-dir="logs" --lr=0.001 --model-level="char" --nhid=500 --nlayers=2 --nsoftmaxes=75 --seed=7 --total-length=10000000
python main.py --architecture="mos" --cluster-run --cluster-run-name="mos_test" --cuda --data="data/news_test" --dropout=0.2 --emsize=200 --lang-switch=100000 --learn-iterations=2 --log-dir="logs" --lr=0.001 --model-level="char" --nhid=500 --nlayers=2 --nsoftmaxes=75 --seed=8 --total-length=10000000
python main.py --architecture="mos" --cluster-run --cluster-run-name="mos_test" --cuda --data="data/news_test" --dropout=0.2 --emsize=200 --lang-switch=100000 --learn-iterations=2 --log-dir="logs" --lr=0.001 --model-level="char" --nhid=500 --nlayers=2 --nsoftmaxes=75 --seed=9 --total-length=10000000
python main.py --architecture="mos" --cluster-run --cluster-run-name="mos_test" --cuda --data="data/news_test" --dropout=0.2 --emsize=200 --lang-switch=10000 --learn-iterations=2 --log-dir="logs" --lr=0.001 --model-level="char" --nhid=500 --nlayers=2 --nsoftmaxes=75 --seed=0 --total-length=1000000
python main.py --architecture="mos" --cluster-run --cluster-run-name="mos_test" --cuda --data="data/news_test" --dropout=0.2 --emsize=200 --lang-switch=10000 --learn-iterations=2 --log-dir="logs" --lr=0.001 --model-level="char" --nhid=500 --nlayers=2 --nsoftmaxes=75 --seed=1 --total-length=1000000
python main.py --architecture="mos" --cluster-run --cluster-run-name="mos_test" --cuda --data="data/news_test" --dropout=0.2 --emsize=200 --lang-switch=10000 --learn-iterations=2 --log-dir="logs" --lr=0.001 --model-level="char" --nhid=500 --nlayers=2 --nsoftmaxes=75 --seed=2 --total-length=1000000
python main.py --architecture="mos" --cluster-run --cluster-run-name="mos_test" --cuda --data="data/news_test" --dropout=0.2 --emsize=200 --lang-switch=10000 --learn-iterations=2 --log-dir="logs" --lr=0.001 --model-level="char" --nhid=500 --nlayers=2 --nsoftmaxes=75 --seed=3 --total-length=1000000
python main.py --architecture="mos" --cluster-run --cluster-run-name="mos_test" --cuda --data="data/news_test" --dropout=0.2 --emsize=200 --lang-switch=10000 --learn-iterations=2 --log-dir="logs" --lr=0.001 --model-level="char" --nhid=500 --nlayers=2 --nsoftmaxes=75 --seed=4 --total-length=1000000
python main.py --architecture="mos" --cluster-run --cluster-run-name="mos_test" --cuda --data="data/news_test" --dropout=0.2 --emsize=200 --lang-switch=10000 --learn-iterations=2 --log-dir="logs" --lr=0.001 --model-level="char" --nhid=500 --nlayers=2 --nsoftmaxes=75 --seed=5 --total-length=1000000
python main.py --architecture="mos" --cluster-run --cluster-run-name="mos_test" --cuda --data="data/news_test" --dropout=0.2 --emsize=200 --lang-switch=10000 --learn-iterations=2 --log-dir="logs" --lr=0.001 --model-level="char" --nhid=500 --nlayers=2 --nsoftmaxes=75 --seed=6 --total-length=1000000
python main.py --architecture="mos" --cluster-run --cluster-run-name="mos_test" --cuda --data="data/news_test" --dropout=0.2 --emsize=200 --lang-switch=10000 --learn-iterations=2 --log-dir="logs" --lr=0.001 --model-level="char" --nhid=500 --nlayers=2 --nsoftmaxes=75 --seed=7 --total-length=1000000
python main.py --architecture="mos" --cluster-run --cluster-run-name="mos_test" --cuda --data="data/news_test" --dropout=0.2 --emsize=200 --lang-switch=10000 --learn-iterations=2 --log-dir="logs" --lr=0.001 --model-level="char" --nhid=500 --nlayers=2 --nsoftmaxes=75 --seed=8 --total-length=1000000
python main.py --architecture="mos" --cluster-run --cluster-run-name="mos_test" --cuda --data="data/news_test" --dropout=0.2 --emsize=200 --lang-switch=10000 --learn-iterations=2 --log-dir="logs" --lr=0.001 --model-level="char" --nhid=500 --nlayers=2 --nsoftmaxes=75 --seed=9 --total-length=1000000
