train: openwebtext
valid: wikitext103
tokenizer_name_or_path: gpt2
cache_dir: ""
wrap: True
streaming: False
insert_train_eos: True
insert_valid_eos: True