#!/bin/bash
set -e

if [ -f .env ]; then
    set -o allexport
    source .env
    set +o allexport
fi

arxiv_dir=out/data/arxiv/v2

python llm_ol/dataset/arxiv/build_pages.py \
    --output_dir $arxiv_dir/pages \
    --date_min "2020-01-01" \
    --date_max "2022-12-31" \