# Precompute space
python precompute_space.py --base_model='qwen2.5-3b' --train_data='truthful_qa' --base_embed_model='all-MiniLM-L6-v2' --sample_num=2  # sample_num=100
python precompute_space.py --base_model='qwen2.5-3b' --train_data='bio' --base_embed_model='all-MiniLM-L6-v2' --sample_num=2
python precompute_space.py --base_model='qwen2.5-3b' --train_data='wiki' --base_embed_model='all-MiniLM-L6-v2' --sample_num=2

# TruthfulQA
python run.py --base_model='qwen2.5-3b' --method='greedy' --data_split='test' --max_sample_num=2 --eval_data='truthful_qa' --evaluation_type='gemini' --batch_size=160 # max_sample_num=417
python run.py --base_model='qwen2.5-3b' --method='dola' --data_split='test' --max_sample_num=2 --eval_data='truthful_qa' --evaluation_type='gemini' --batch_size=160
python run.py --base_model='qwen2.5-3b' --method='instructive' --data_split='test' --max_sample_num=2 --eval_data='truthful_qa' --noisy_prompt_key='opposite_zero' --evaluation_type='gemini' --batch_size=160 # ID
python run.py --base_model='qwen2.5-3b' --method='instructive' --data_split='test' --max_sample_num=2 --eval_data='truthful_qa' --noisy_prompt_key='cad_zero' --evaluation_type='gemini' --batch_size=160 # CAD
python run.py --base_model='qwen2.5-3b' --method='icl' --data_split='test' --max_sample_num=2 --eval_data='truthful_qa' --train_data='truthful_qa' --evaluation_type='gemini' --batch_size=160
python run.py --base_model='qwen2.5-3b' --method='adaptive' --data_split='test' --max_sample_num=2 --eval_data='truthful_qa' --train_data='truthful_qa' --evaluation_type='gemini' --batch_size=160 

# Biogarphies
python run.py --base_model='qwen2.5-3b' --method='greedy' --data_split='test' --max_sample_num=2 --eval_data='bio' --batch_size=32 --evaluation_type='gemini' # max_sample_num=128
python run.py --base_model='qwen2.5-3b' --method='dola' --data_split='test' --max_sample_num=2 --eval_data='bio' --batch_size=32 --evaluation_type='gemini'
python run.py --base_model='qwen2.5-3b' --method='icl' --data_split='test' --max_sample_num=2 --eval_data='bio' --train_data='bio' --standard_prompt_key='few_shot_bio' --batch_size=32 --evaluation_type='gemini'
python run.py --base_model='qwen2.5-3b' --method='instructive' --data_split='test' --max_sample_num=2 --eval_data='bio' --noisy_prompt_key='opposite_bio' --batch_size=32 --evaluation_type='gemini' # ID
python run.py --base_model='qwen2.5-3b' --method='instructive' --data_split='test' --max_sample_num=2 --eval_data='bio' --noisy_prompt_key='cad_bio' --batch_size=32 --evaluation_type='gemini' # CAD
python run.py --base_model='qwen2.5-3b' --method='adaptive' --data_split='test' --max_sample_num=2 --eval_data='bio' --train_data='bio' --batch_size=32 --evaluation_type='gemini'

# OOD
python run.py --base_model='qwen2.5-3b' --method='adaptive' --data_split='test' --max_sample_num=2 --eval_data='bio' --train_data='' --batch_size=32 --evaluation_type='gemini' # max_sample_num=128
python run.py --base_model='qwen2.5-3b' --method='greedy' --data_split='test' --max_sample_num=2 --eval_data='bio' --standard_prompt_key='few_shot_bio_ood' --batch_size=32 --evaluation_type='gemini'

# Wiki
python run.py --base_model='qwen2.5-3b' --method='greedy' --data_split='test' --max_sample_num=2 --eval_data='wiki' --evaluation_type='gemini' --batch_size=160
python run.py --base_model='qwen2.5-3b' --method='dola' --data_split='test' --max_sample_num=2 --eval_data='wiki' --evaluation_type='gemini' --batch_size=160
python run.py --base_model='qwen2.5-3b' --method='instructive' --data_split='test' --max_sample_num=2 --eval_data='wiki' --noisy_prompt_key='opposite_zero' --evaluation_type='gemini' --batch_size=160 # ID
python run.py --base_model='qwen2.5-3b' --method='instructive' --data_split='test' --max_sample_num=2 --eval_data='wiki' --noisy_prompt_key='cad_zero' --evaluation_type='gemini' --batch_size=160 # CAD
python run.py --base_model='qwen2.5-3b' --method='icl' --data_split='test' --max_sample_num=2 --eval_data='wiki' --train_data='wiki' --evaluation_type='gemini' --batch_size=160
python run.py --base_model='qwen2.5-3b' --method='adaptive' --data_split='test' --max_sample_num=2 --eval_data='wiki' --train_data='wiki' --evaluation_type='gemini' --batch_size=160 # max_sample_num=1000