#!/bin/bash

python perplexity_yarn.py --tokenized output/govreport-test-tokenized-awq \
 --dataset-min-tokens 20384 --samples 10 \
 --output-file ppl_results/awq_int_yarn_8_llama2-7b_nonchat_baseline/awq_int_yarn_8_llama2-7b_nonchat_baseline \
 --min-tokens 256 --max-tokens 19456 -m meta-llama/Llama-2-7b-hf \
 --awq_cache llm-awq/awq_cache/llama-2-7b-w4-g128.pt \
 --beta_point 1287 --sliding-window 2048 --tokens-step 384 --aggressive-memory --yarn 8 \
 --original --custom-model --original-max-position-embeddings 2048 --awq \
