# train
'''
python main.py \
  --net <model_name> \
  --set_seed <init_seed> \
  --save_net <model_save_path> \
  --imgs 500,5000,1600 \
  --resolution 500 \
  --active_log \
  --epochs <number_epochs> \
  --lr <suitable_learningrate>
'''
python main.py \
  --net 'fcnet' \
  --set_seed 42 \
  --save_net 'fcnet' \
  --plot_path './plots/fcnet' \
  --imgs 500,5000,1600 \
  --resolution 500 \
  --epochs 200 \
  --lr 0.001

# just use 0 1 2
python main.py \
  --net 'resnet' \
  --set_seed 42 \
  --save_net 'resnet' \
  --plot_path './plots/resnet' \
  --imgs 500,5000,1600 \
  --resolution 500 \
  --epochs 200 \
  --lr 0.001


python main.py \
  --net 'MLPMixer4' \
  --set_seed 42 \
  --save_net 'MLPMixer4' \
  --plot_path './plots/MLPMixer4' \
  --imgs 500,5000,1600 \
  --resolution 500 \
  --epochs 200 \
  --lr 0.001

python main.py \
  --net 'vit' \
  --set_seed 42 \
  --save_net 'vit' \
  --plot_path './plots/vit' \
  --imgs 500,5000,1600 \
  --resolution 500 \
  --epochs 200 \
  --lr 0.001

python main.py \
  --net 'vgg' \
  --set_seed 42 \
  --save_net 'vgg' \
  --plot_path './plots/vgg' \
  --imgs 500,5000,1600 \
  --resolution 500 \
  --epochs 200 \
  --lr 0.001

python main.py \
  --net 'densenet' \
  --set_seed 42 \
  --save_net 'densenet' \
  --plot_path './plots/densenet' \
  --imgs 500,5000,1600 \
  --resolution 500 \
  --epochs 200 \
  --lr 0.001

# try plot fig1 and 3
python main.py --net 'fcnet' --load_net './saved_models/naive/42/fcnet.pth' --plot_path ./images/test/ --imgs 30,72,42 --set_seed 0 --range_l 0.5 --range_r 0.5
python temp.py --net 'fcnet' --load_net './saved_models/naive/42/fcnet.pth' --plot_path ./images/test_new/ --imgs 30,72,42 --set_seed 0 --range_l 0.5 --range_r 0.5

# region counts 
python fragmentation.py --net 'fcnet' --load_net './saved_models/naive/42/fcnet.pth' --set_seed 0 --epochs 100
python fragmentation.py --net 'MLPMixer4' --load_net './saved_models/naive/42/MLPMixer4.pth' --set_seed 0 --epochs 100
python fragmentation.py --net 'vit' --load_net './saved_models/naive/42/vit.pth' --set_seed 0 --epochs 100
python fragmentation.py --net 'vgg' --load_net './saved_models/naive/42/vgg.pth' --set_seed 0 --epochs 100
python fragmentation.py --net 'densenet' --load_net './saved_models/naive/42/densenet.pth' --set_seed 0 --epochs 100
python fragmentation.py --net 'resnet' --load_net './saved_models/naive/42/resnet.pth' --set_seed 0 --epochs 100

# generalization gap
python generalization_gap.py --net 'fcnet' --load_net './saved_models/naive/42/fcnet.pth'
python generalization_gap.py --net 'MLPMixer4' --load_net './saved_models/naive/42/MLPMixer4.pth'
python generalization_gap.py --net 'vit' --load_net './saved_models/naive/42/vit.pth'
python generalization_gap.py --net 'vgg' --load_net './saved_models/naive/42/vgg.pth'
python generalization_gap.py --net 'densenet' --load_net './saved_models/naive/42/densenet.pth'
python generalization_gap.py --net 'resnet' --load_net './saved_models/naive/42/resnet.pth'

# more models
python main.py --net 'resnet' --set_seed 42 --save_net 'resnet_lr_0.001_bs_256_wd_1e-5' --plot_path './plots/resnet' --imgs 500,5000,1600 --resolution 500 --epochs 200 --lr 0.001 --bs 256 --weight_decay 1e-5

# fit poly 1d in resnet
python ./poly/in_1_OLS.py --net 'resnet' --set_seed 42 --load_net './saved_models/naive/42/resnet.pth'  --imgs 500,5000
python ./poly/in_1_OLS.py --net 'resnet' --set_seed 42 --load_net './saved_models/naive/42/resnet.pth'
python ./poly/in_1_OLS.py --net 'fcnet' --set_seed 42 --load_net './saved_models/naive/42/fcnet.pth' --imgs 500,5000
python ./poly/in_1_OLS.py --net 'MLPMixer4' --set_seed 42 --load_net './saved_models/naive/42/MLPMixer4.pth'
python ./poly/in_1_OLS.py --net 'vit' --set_seed 42 --load_net './saved_models/naive/42/vit.pth'
python ./poly/in_1_OLS.py --net 'vgg' --set_seed 42 --load_net './saved_models/naive/42/vgg.pth'
python ./poly/in_1_OLS.py --net 'densenet' --set_seed 42 --load_net './saved_models/naive/42/densenet.pth'

# region counts 1d
python fragmentation_1d.py --net 'resnet' --load_net './saved_models/naive/42/resnet.pth' --set_seed 0 --epochs 100

# pic interpolation 1d
python ./poly/show_1d.py --imgs 500,5000

# test 1d
python test_1d_rc.py --net 'resnet' --load_net './saved_models/naive/42/resnet.pth' --set_seed 0 --epochs 100 --resolution 500
# good to try python test_1d_rc.py --net 'resnet' --load_net './saved_models/naive/42/resnet.pth' --set_seed 0 --epochs 700 --resolution 200

# region counts new(different model arc)
python fragmentation_1d.py --net 'fcnet' --load_net './saved_models/naive/42/fcnet.pth' --set_seed 0 --epochs 700 --resolution 200
python fragmentation_1d.py --net 'MLPMixer4' --load_net './saved_models/naive/42/MLPMixer4.pth' --set_seed 0 --epochs 700 --resolution 200
python fragmentation_1d.py --net 'vit' --load_net './saved_models/naive/42/vit.pth' --set_seed 0 --epochs 700 --resolution 200
python fragmentation_1d.py --net 'vgg' --load_net './saved_models/naive/42/vgg.pth' --set_seed 0 --epochs 700 --resolution 200
python fragmentation_1d.py --net 'densenet' --load_net './saved_models/naive/42/densenet.pth' --set_seed 0 --epochs 700 --resolution 200
python fragmentation_1d.py --net 'resnet' --load_net './saved_models/naive/42/resnet.pth' --set_seed 0 --epochs 700 --resolution 200

# back to 2d
python fragmentation.py --net 'resnet' --load_net './saved_models/naive/42/resnet.pth' --set_seed 0 --epochs 500  --resolution 200

# test AIC
python ./poly/in_1_OLS_test.py --net 'resnet' --set_seed 0 --load_net './saved_models/naive/42/resnet.pth' --epochs 400  --resolution 500 --imgs 500,5000
python ./poly/in_1_OLS_test.py --net 'resnet' --set_seed 0 --load_net './saved_models/no_aug/42/resnet_lr0_001_bs1024_wd1e-5.pth' --epochs 400  --resolution 500 --imgs 500,5000
python ./poly/in_1_OLS_test.py --net 'resnet' --set_seed 0 --load_net './saved_models/naive/42/resnet_lr0_01_bs1024_wd1e-5.pth' --epochs 400  --resolution 500 --imgs 500,5000


# try para
python ./poly/test_regular_max.py --net 'resnet' --set_seed 0 --load_net './saved_models/naive/42/resnet.pth' --epochs 400  --resolution 500 --imgs 500,5000
# should big
python ./poly/test_regular_max.py --net 'resnet' --set_seed 0 --load_net './saved_models/no_aug/42/resnet_lr0_001_bs256_wd1e-5.pth' --epochs 400  --resolution 500 --imgs 500,5000
# should small
python ./poly/test_regular_max.py --net 'resnet' --set_seed 0 --load_net './saved_models/no_aug/42/resnet_lr0_01_bs1024_wd1e-6.pth' --epochs 400  --resolution 500 --imgs 500,5000

# weighted
python ./poly/weighted_degree.py --net 'resnet' --set_seed 0 --load_net './saved_models/naive/42/resnet.pth' --epochs 400  --resolution 500 --imgs 500,5000
python ./poly/weighted_degree.py --net 'resnet' --set_seed 0 --load_net './saved_models/no_aug/42/resnet_lr0_1_bs1024_wd1e-6.pth' --epochs 1000  --resolution 500 --imgs 500,5000

# 2d weighted cheb
python ./poly/weighted_degree_2d.py --net 'resnet' --set_seed 0 --load_net './saved_models/naive/42/resnet.pth' --epochs 400  --resolution 100 --imgs 500,5000,1600
python ./poly/weighted_degree_2d.py --net 'resnet' --set_seed 0 --load_net './saved_models/naive/42/resnet.pth' --epochs 700  --resolution 100 --imgs 500,5000,1600

# wd reg
python train_wd_regular.py --net "resnet" --set_seed 0 --save_net "resnet_wd_regular" --plot_path "./images/wd_reg" --imgs 500,5000 --resolution 100 --epochs 200 --lr 0.001 --bs 256 --lambda_reg 0.01 --weight_decay 1e-5
python ./poly/weighted_degree.py --net 'resnet' --set_seed 0 --load_net './saved_models/wd_reg/0/resnet_wd_regular.pth' --epochs 400  --resolution 500 --imgs 500,5000
python polynet.py --set_seed 0 --resolution 500 --epochs 200 --lr 0.001 --bs 32
python ./poly/weighted_degree.py --net 'resnet' --set_seed 0 --load_net './saved_models/wd_reg/0/resnet_wd_regular.pth' --epochs 400  --resolution 500 --imgs 500,5000
python ./poly/weighted_degree.py --net 'resnet' --set_seed 0 --load_net './saved_models/wd_reg/0/resnet_wd_regular_0.pth' --epochs 400  --resolution 500 --imgs 500,5000

python train_wd_regular.py --net "resnet" --set_seed 0 --save_net "resnet_wd_regular_no_eval" --plot_path "./images/wd_reg" --imgs 500,5000 --resolution 100 --epochs 200 --lr 0.001 --bs 256 --lambda_reg 0.01 --weight_decay 1e-5
python train_wd_regular.py --net "resnet" --set_seed 0 --save_net "resnet_wd_regular_lambda_0.001" --plot_path "./images/wd_reg" --imgs 500,5000 --resolution 100 --epochs 200 --lr 0.001 --bs 256 --lambda_reg 0.001 --weight_decay 1e-5
python train_wd_regular.py --net "resnet" --set_seed 0 --save_net "resnet_wd_regular_lambda_0.1" --plot_path "./images/wd_reg" --imgs 500,5000 --resolution 100 --epochs 200 --lr 0.001 --bs 256 --lambda_reg 0.1 --weight_decay 1e-5
python train_wd_regular.py --net "resnet" --set_seed 0 --save_net "resnet_wd_regular_lambda_0.1_no_eval" --plot_path "./images/wd_reg" --imgs 500,5000 --resolution 100 --epochs 200 --lr 0.001 --bs 256 --lambda_reg 0.1 --weight_decay 1e-5
python train_wd_regular.py --net "resnet" --set_seed 0 --save_net "resnet_wd_regular_no_reg" --plot_path "./images/wd_reg" --imgs 500,5000 --resolution 100 --epochs 200 --lr 0.001 --bs 256 --lambda_reg -1 --weight_decay 1e-5
python ./poly/weighted_degree.py --net 'resnet' --set_seed 0 --load_net './saved_models/no_aug/42/resnet_lr0_001_bs256_wd1e-5.pth' --epochs 400  --resolution 500 --imgs 500,5000
python ./poly/weighted_degree.py --net 'resnet' --set_seed 0 --load_net './saved_models/wd_reg/0/resnet_wd_regular_no_reg.pth' --epochs 400  --resolution 100 --imgs 500,5000

# try other hyper: lr
python train_wd_regular.py --net "resnet" --set_seed 0 --save_net "resnet_wd_regular_lambda_0.01_lr_0.01" --plot_path "./images/wd_reg" --imgs 500,5000 --resolution 100 --epochs 200 --lr 0.01 --bs 256 --lambda_reg 0.01 --weight_decay 1e-5
python ./poly/weighted_degree.py --net 'resnet' --set_seed 0 --load_net './saved_models/wd_reg/0/resnet_wd_regular_lambda_0.1_no_eval.pth' --epochs 400  --resolution 100 --imgs 500,5000
python train_wd_regular.py --net "resnet" --set_seed 0 --save_net "resnet_wd_regular_lambda_0.01_lr_0.1" --plot_path "./images/wd_reg" --imgs 500,5000 --resolution 100 --epochs 200 --lr 0.1 --bs 256 --lambda_reg 0.01 --weight_decay 1e-5
python train_wd_regular.py --net "resnet" --set_seed 0 --save_net "resnet_wd_regular_lambda_0.01_lr_0.1" --plot_path "./images/wd_reg" --imgs 500,5000 --resolution 100 --epochs 200 --lr 0.1 --bs 256 --lambda_reg 0.01 --weight_decay 1e-5

# try 25 epoch free
python train_wd_regular.py --net "resnet" --set_seed 0 --save_net "resnet_wd_regular_free_25_lambda_0.01_lr_0.001" --plot_path "./images/wd_reg" --imgs 500,5000 --resolution 100 --epochs 200 --lr 0.001 --bs 256 --lambda_reg 0.01 --weight_decay 1e-5
python train_wd_regular.py --net "resnet" --set_seed 0 --save_net "resnet_wd_regular_free_25_lambda_0.01_lr_0.01" --plot_path "./images/wd_reg" --imgs 500,5000 --resolution 100 --epochs 200 --lr 0.01 --bs 256 --lambda_reg 0.01 --weight_decay 1e-5
python train_wd_regular.py --net "resnet" --set_seed 0 --save_net "resnet_wd_regular_free_25_lambda_0.01_lr_0.1" --plot_path "./images/wd_reg" --imgs 500,5000 --resolution 100 --epochs 200 --lr 0.1 --bs 256 --lambda_reg 0.01 --weight_decay 1e-5
python read_data.py --net "resnet" --set_seed 0 --save_net "resnet_wd_regular_free_25_lambda_0.01_lr_0.001"
python read_data.py --net "resnet" --set_seed 0 --save_net "resnet_wd_regular_free_25_lambda_0.01_lr_0.1"
python train_wd_regular.py --net "resnet" --set_seed 0 --save_net "resnet_wd_regular_free_25_lambda_0.01_lr_0.1_cos" --plot_path "./images/wd_reg" --imgs 500,5000 --resolution 100 --epochs 200 --lr 0.1 --bs 256 --lambda_reg 0.01 --scheduler "cosine" --weight_decay 1e-5
python ./poly/weighted_degree.py --net 'resnet' --set_seed 0 --load_net './saved_models/wd_reg/0/resnet_wd_regular_free_25_lambda_0.01_lr_0.1/resnet_wd_regular_free_25_lambda_0.01_lr_0.1_174.pth' --epochs 400  --resolution 100 --imgs 500,5000
python train_wd_regular.py --net "resnet" --set_seed 0 --save_net "resnet_wd_regular_free_25_lambda_0.01_lr_0.1_no_const" --plot_path "./images/wd_reg" --imgs 500,5000 --resolution 100 --epochs 200 --lr 0.1 --bs 256 --lambda_reg 0.01 --weight_decay 1e-5
python read_data.py --net "resnet" --set_seed 0 --save_net "resnet_wd_regular_free_25_lambda_0.01_lr_0.1_no_const"
python ./poly/weighted_degree.py --net 'resnet' --set_seed 0 --load_net './saved_models/wd_reg/0/resnet_wd_regular_free_25_lambda_0.01_lr_0.1_no_const/resnet_wd_regular_free_25_lambda_0.01_lr_0.1_no_const_25.pth' --epochs 400  --resolution 100 --imgs 500,5000
python train_wd_regular.py --net "resnet" --set_seed 0 --save_net "resnet_wd_regular_free_25_lambda_0.001_lr_0.1" --plot_path "./images/wd_reg" --imgs 500,5000 --resolution 100 --epochs 200 --lr 0.1 --bs 256 --lambda_reg 0.001 --weight_decay 1e-5
python read_data.py --net "resnet" --set_seed 0 --save_net "resnet_wd_regular_free_25_lambda_0.01_lr_0.1_no_const"
python train_wd_regular.py --net "resnet" --set_seed 0 --save_net "resnet_wd_regular_no_reg_lr_0.1" --plot_path "./images/wd_reg" --imgs 500,5000 --resolution 100 --epochs 200 --lr 0.1 --bs 256 --lambda_reg -1 --weight_decay 1e-5
python read_data.py --net "resnet" --set_seed 0 --save_net "resnet_wd_regular_free_25_lambda_0.001_lr_0.1"
python train_wd_regular.py --net "resnet" --set_seed 0 --save_net "resnet_wd_regular_no_reg_lr_0.01" --plot_path "./images/wd_reg" --imgs 500,5000 --resolution 100 --epochs 200 --lr 0.01 --bs 256 --lambda_reg -1 --weight_decay 1e-5
python train_wd_regular.py --net "resnet" --set_seed 0 --save_net "resnet_wd_regular_free_25_lambda_0.005_lr_0.1" --plot_path "./images/wd_reg" --imgs 500,5000 --resolution 100 --epochs 200 --lr 0.1 --bs 256 --lambda_reg 0.005 --weight_decay 1e-5
python train_wd_regular.py --net "resnet" --set_seed 0 --save_net "resnet_wd_regular_free_25_lambda_0.002_lr_0.1" --plot_path "./images/wd_reg" --imgs 500,5000 --resolution 100 --epochs 200 --lr 0.1 --bs 256 --lambda_reg 0.002 --weight_decay 1e-5

# with miu
python train_wd_regular.py --net "resnet" --set_seed 0 --save_net "resnet_wd_regular_free_25_lambda_0.01_lr_0.1_miu_0.02" --plot_path "./images/wd_reg" --imgs 500,5000 --resolution 100 --epochs 200 --lr 0.1 --bs 256 --lambda_reg 0.01 --weight_decay 1e-5 --miu 0.02
python ./poly/weighted_degree.py --net 'resnet' --set_seed 0 --load_net './saved_models/wd_reg/0/resnet_wd_regular_free_25_lambda_0.01_lr_0.1_miu_0.02/resnet_wd_regular_free_25_lambda_0.01_lr_0.1_miu_0.02_25.pth' --epochs 400  --resolution 100 --imgs 500,5000
python train_wd_regular.py --net "resnet" --set_seed 0 --save_net "resnet_wd_regular_free_25_aug_no_reg_lr_0.1" --plot_path "./images/wd_reg" --imgs 500,5000 --resolution 100 --epochs 200 --lr 0.1 --bs 256 --lambda_reg -1 --weight_decay 1e-5 --use_data_aug True
python test.py  --net 'resnet' --set_seed 0 --load_net './saved_models/wd_reg/0/resnet_wd_regular_free_25_lambda_0.01_lr_0.1_miu_0.02/resnet_wd_regular_free_25_lambda_0.01_lr_0.1_miu_0.02_25.pth' --epochs 400  --resolution 100 --imgs 500,5000
python test.py  --net 'resnet' --set_seed 0 --load_net './saved_models/wd_reg/0/resnet_wd_regular_free_25_lambda_0.01_lr_0.1/resnet_wd_regular_free_25_lambda_0.01_lr_0.1_174.pth' --epochs 400  --resolution 100 --imgs 500,5000
python test.py  --net 'resnet' --set_seed 0 --load_net './saved_models/wd_reg/0/resnet_wd_regular_free_25_lambda_0.01_lr_0.1_no_const/resnet_wd_regular_free_25_lambda_0.01_lr_0.1_no_const_25.pth' --epochs 400  --resolution 100 --imgs 500,5000


# margin
python margin.py  --net 'resnet' --set_seed 0 --load_net './saved_models/wd_reg/0/resnet_wd_regular_free_25_lambda_0.01_lr_0.1_miu_0.02/resnet_wd_regular_free_25_lambda_0.01_lr_0.1_miu_0.02_25.pth' --epochs 400  --resolution 100 --imgs 500,5000
python read_data.py --net "resnet" --set_seed 0 --save_net "resnet_wd_regular_free_25_lambda_0.01_lr_0.1_miu_0.02"
python margin.py  --net 'resnet' --set_seed 0 --load_net './saved_models/wd_reg/0/resnet_wd_regular_free_25_lambda_0.01_lr_0.1_miu_0.02/resnet_wd_regular_free_25_lambda_0.01_lr_0.1_miu_0.02_25.pth' --epochs 400  --resolution 100 --imgs 500,5000

python train_wd_regular.py --net "resnet" --set_seed 0 --save_net "resnet_wd_regular_free_25_lambda_0.01_lr_0.1_miu_0.02_new" --plot_path "./images/wd_reg" --imgs 500,5000 --resolution 100 --epochs 200 --lr 0.1 --bs 256 --lambda_reg 0.01 --weight_decay 1e-5 --miu 0.02 # shuffle
python margin.py  --net 'resnet' --set_seed 0 --load_net './saved_models/wd_reg/0/resnet_wd_regular_free_25_lambda_0.01_lr_0.1_miu_0.02_new/resnet_wd_regular_free_25_lambda_0.01_lr_0.1_miu_0.02_new_25.pth' --epochs 400  --resolution 100 --imgs 500,5000

# try vit without drop out
python train_wd_regular.py --net "vit_no_dropout" --set_seed 0 --save_net "vit_wd_regular_free_25_lambda_0.01_lr_0.1_miu_0.02" --plot_path "./images/wd_reg" --imgs 500,5000 --resolution 100 --epochs 200 --lr 0.1 --bs 256 --lambda_reg 0.01 --weight_decay 1e-5 --miu 0.02
python margin.py  --net 'vit_no_dropout' --set_seed 0 --load_net './saved_models/wd_reg/0/vit_wd_regular_free_25_lambda_0.01_lr_0.1_miu_0.02/vit_wd_regular_free_25_lambda_0.01_lr_0.1_miu_0.02_25.pth' --epochs 400  --resolution 100 --imgs 500,5000
python train_wd_regular.py --net "vit_no_dropout" --set_seed 0 --save_net "vit_wd_regular_free_25_lambda_0.1_lr_0.1_miu_0.02" --plot_path "./images/wd_reg" --imgs 500,5000 --resolution 100 --epochs 200 --lr 0.1 --bs 256 --lambda_reg 0.1 --weight_decay 1e-5 --miu 0.02
python train_wd_regular.py --net "vit_no_dropout" --set_seed 0 --save_net "vit_wd_regular_free_25_lambda_0.01_lr_0.1_miu_0.02_no_reg" --plot_path "./images/wd_reg" --imgs 500,5000 --resolution 100 --epochs 200 --lr 0.1 --bs 256 --lambda_reg -1 --weight_decay 1e-5 --miu 0.02
python train_wd_regular.py --net "vit" --set_seed 0 --save_net "vit_dropout_wd_regular_free_25_lambda_0.01_lr_0.1_miu_0.02" --plot_path "./images/wd_reg" --imgs 500,5000 --resolution 100 --epochs 200 --lr 0.1 --bs 256 --lambda_reg 0.01 --weight_decay 1e-5 --miu 0.02
python train_wd_regular.py --net "vit" --set_seed 0 --save_net "vit_dropout_wd_regular_free_25_lambda_0.1_lr_0.1_miu_0.02" --plot_path "./images/wd_reg" --imgs 500,5000 --resolution 100 --epochs 200 --lr 0.1 --bs 256 --lambda_reg 0.1 --weight_decay 1e-5 --miu 0.02
python ./poly/weighted_degree.py --net 'vit' --set_seed 0 --load_net './saved_models/wd_reg/0/vit_dropout_wd_regular_free_25_lambda_0.01_lr_0.1_miu_0.02/vit_dropout_wd_regular_free_25_lambda_0.01_lr_0.1_miu_0.02_last.pth' --epochs 400  --resolution 100 --imgs 500,5000
python train_wd_regular.py --net "resnet" --set_seed 0 --save_net "resnet_wd_regular_free_25_dynamic_lambda_0.01_lr_0.1_miu_0.02" --plot_path "./images/wd_reg" --imgs 500,5000 --resolution 100 --epochs 200 --lr 0.1 --bs 256 --lambda_reg 0.01 --weight_decay 1e-5 --miu 0.02
python train_wd_regular.py --net "resnet" --set_seed 0 --save_net "resnet_wd_regular_free_25_AdamW_lambda_0.01_lr_0.1_miu_0.02" --plot_path "./images/wd_reg" --imgs 500,5000 --resolution 100 --epochs 200 --lr 0.1 --bs 256 --lambda_reg 0.01 --weight_decay 1e-5 --miu 0.02 --opt "AdamW"
python train_wd_regular.py --net "vit_tiny" --set_seed 0 --save_net "vit_tiny_wd_regular_free_25_AdamW_lambda_0.01_lr_0.001_miu_0.02" --plot_path "./images/wd_reg" --imgs 500,5000 --resolution 100 --epochs 200 --lr 0.001 --bs 256 --lambda_reg 0.01 --weight_decay 1e-5 --miu 0.02 --opt "AdamW"
python train_wd_regular.py --net "resnet" --set_seed 0 --save_net "resnet_wd_regular_free_25_AdamW_lambda_0.01_lr_0.01_miu_0.02" --plot_path "./images/wd_reg" --imgs 500,5000 --resolution 100 --epochs 200 --lr 0.01 --bs 256 --lambda_reg 0.01 --weight_decay 1e-5 --miu 0.02 --opt "AdamW"
python train_wd_regular.py --net "resnet" --set_seed 0 --save_net "resnet_wd_regular_free_25_AdamW_lambda_0.01_lr_0.001_miu_0.02" --plot_path "./images/wd_reg" --imgs 500,5000 --resolution 100 --epochs 200 --lr 0.001 --bs 256 --lambda_reg 0.01 --weight_decay 1e-5 --miu 0.02 --opt "AdamW"
python train_wd_regular.py --net "vit_tiny" --set_seed 0 --save_net "vit_tiny_no_reg_AdamW_lr_0.001" --plot_path "./images/wd_reg" --imgs 500,5000 --resolution 100 --epochs 200 --lr 0.001 --bs 256 --lambda_reg -1 --weight_decay 1e-5 --miu 0.02 --opt "AdamW"

# default
python train_wd_regular.py --net "vit_tiny" --set_seed 0 --save_net "vit_tiny_default_AdamW_lr_0.001" --plot_path "./images/wd_reg" --imgs 500,5000 --resolution 100 --lambda_reg 0.01 --miu 0.02 --opt "AdamW"
python train_wd_regular.py --net "resnet" --set_seed 0 --save_net "resnet_default_AdamW_lr_0.001" --plot_path "./images/wd_reg" --imgs 500,5000 --resolution 100 --lambda_reg 0.01 --miu 0.02 --opt "AdamW"
python train_wd_regular.py --net "vit_tiny" --set_seed 0 --save_net "vit_tiny_default_AdamW_lr_0.001_no_reg" --plot_path "./images/wd_reg" --imgs 500,5000 --resolution 100 --lambda_reg -1 --miu 0.02 --opt "AdamW"
python train_wd_regular.py --net "vit_tiny" --set_seed 0 --save_net "vit_tiny_default_AdamW_lr_0.001_no_miu" --plot_path "./images/wd_reg" --imgs 500,5000 --resolution 100 --lambda_reg 0.01 --opt "AdamW"
python train_wd_regular.py --net "vit_tiny" --set_seed 0 --save_net "vit_tiny_aug_AdamW_lr_0.001" --plot_path "./images/wd_reg" --imgs 500,5000 --resolution 100 --lambda_reg 0.01 --miu 0.02 --opt "AdamW" --use_data_aug
python train_wd_regular.py --net "vit_tiny" --set_seed 0 --save_net "vit_tiny_aug_AdamW_lr_0.001_no_reg" --plot_path "./images/wd_reg" --imgs 500,5000 --resolution 100 --lambda_reg -1 --miu 0.02 --opt "AdamW" --use_data_aug
python train_wd_regular.py --net "resnet_no_bn" --set_seed 0 --save_net "resnet_no_bn_default_AdamW_lr_0.001" --plot_path "./images/wd_reg" --imgs 500,5000 --resolution 100 --lambda_reg 0.01 --miu 0.02 --opt "AdamW"
python train_wd_regular.py --net "resnet_no_bn" --set_seed 0 --save_net "resnet_no_bn_default_AdamW_lr_0.001_no_reg" --plot_path "./images/wd_reg" --imgs 500,5000 --resolution 100 --lambda_reg -1 --miu 0.02 --opt "AdamW"

python test.py  --net 'vit_tiny' --set_seed 0 --load_net './saved_models/wd_reg/0/vit_tiny_aug_AdamW_lr_0.001_no_reg/vit_tiny_aug_AdamW_lr_0.001_no_reg.pth' --epochs 400  --resolution 100 --imgs 500,5000


python train_wd_regular.py --net "resnet" --set_seed 0 --save_net "resnet_default_AdamW_lr_0.001_resolution_500" --plot_path "./images/wd_reg" --imgs 500,5000 --resolution 500 --lambda_reg 0.01 --miu 0.02 --opt "AdamW"
python train_wd_regular.py --net "vit_tiny" --set_seed 0 --save_net "vit_tiny_aug_AdamW_lr_0.001_resolution_500" --plot_path "./images/wd_reg" --imgs 500,5000 --resolution 500 --lambda_reg 0.01 --miu 0.02 --opt "AdamW" --use_data_aug

# sweep
python ./poly/weighted_degree.py --net 'resnet' --set_seed 0 --load_net './saved_models/wd_reg/0/resnet_wd_regular_no_reg.pth' --epochs 700  --resolution 100 --imgs 500,5000 --max_degree 30
python ./poly/weighted_degree_sum.py --net 'resnet' --set_seed 0 --load_net './saved_models/wd_reg/0/resnet_wd_regular_no_reg.pth' --epochs 700  --resolution 200 --imgs 500,5000 --max_degree 40

# cheb node
python train_wd_regular.py --net "resnet" --set_seed 0 --save_net "resnet_default_ChebNode_AdamW_lr_0.001" --plot_path "./images/wd_reg" --imgs 500,5000 --resolution 100 --lambda_reg 0.01 --miu 0.02 --opt "AdamW"
python train_wd_regular.py --net "vit_tiny" --set_seed 0 --save_net "vit_tiny_default_ChebNode_AdamW_lr_0.001" --plot_path "./images/wd_reg" --imgs 500,5000 --resolution 100 --lambda_reg 0.01 --miu 0.02 --opt "AdamW"

# new batch norm
python train_wd_regular.py --net "resnet" --set_seed 0 --save_net "resnet_default_newbn_AdamW_lr_0.001" --plot_path "./images/wd_reg" --imgs 500,5000 --resolution 100 --lambda_reg 0.01 --miu 0.02 --opt "AdamW"
python train_wd_regular.py --net "resnet" --set_seed 0 --save_net "resnet_default_no_reg_AdamW_lr_0.001" --plot_path "./images/wd_reg" --imgs 500,5000 --resolution 100 --lambda_reg -1 --miu 0.02 --opt "AdamW"

# bn freeze
python train_wd_regular.py --net "resnet" --set_seed 0 --save_net "resnet_default_bn_freeze_AdamW_lr_0.001" --plot_path "./images/wd_reg" --imgs 500,5000 --resolution 100 --epochs 200 --lr 0.001 --lambda_reg 0.01 --miu 0.02 --opt "AdamW"
python train_wd_regular.py --net "resnet" --set_seed 0 --save_net "resnet_default_no_reg_AdamW_lr_0.001" --plot_path "./images/wd_reg" --imgs 500,5000 --resolution 100 --epochs 200 --lr 0.001 --lambda_reg -1 --miu 0.02 --opt "AdamW"
# restore
python train_wd_regular.py --net "resnet" --set_seed 0 --save_net "resnet_default_bn_freeze_restore" --plot_path "./images/wd_reg" --imgs 500,5000 --resolution 100 --epochs 200 --lr 0.001 --lambda_reg 0.01 --miu 0.02 --opt "AdamW"
# min degree: 1
python train_wd_regular.py --net "resnet" --set_seed 0 --save_net "resnet_default_bn_freeze_no_const_AdamW_lr_0.001" --plot_path "./images/wd_reg" --imgs 500,5000 --resolution 100 --epochs 200 --lr 0.001 --lambda_reg 0.01 --miu 0.02 --opt "AdamW"

python ./poly/weighted_degree.py  --net 'resnet' --set_seed 0 --load_net './saved_models/wd_reg/0/resnet_default_bn_freeze_AdamW_lr_0.001/resnet_default_bn_freeze_AdamW_lr_0.001_last.pth' --epochs 400  --resolution 100 --imgs 500,5000
python train_wd_regular.py --net "resnet" --set_seed 0 --save_net "resnet_default_bn_freeze_no_const_AdamW_lr_0.001_lambda_0.001" --plot_path "./images/wd_reg" --imgs 500,5000 --resolution 100 --epochs 200 --lr 0.001 --lambda_reg 0.001 --miu 0.02 --opt "AdamW"
python ./poly/weighted_degree.py  --net 'resnet' --set_seed 0 --load_net './saved_models/wd_reg/0/resnet_default_bn_freeze_no_const_AdamW_lr_0.001/resnet_default_bn_freeze_no_const_AdamW_lr_0.001_150.pth' --epochs 400  --resolution 100 --imgs 500,5000
python train_wd_regular.py --net "resnet" --set_seed 0 --save_net "resnet_test" --plot_path "./images/wd_reg" --imgs 500,5000 --resolution 100 --epochs 200 --lr 0.001 --lambda_reg 0.001 --miu 0.02 --opt "AdamW"

# test on train mode
python train_wd_regular.py --net "resnet" --set_seed 0 --save_net "resnet_default_bn_freeze_no_const_AdamW_lr_0.001_train_mode" --plot_path "./images/wd_reg" --imgs 500,5000 --resolution 100 --epochs 200 --lr 0.001 --lambda_reg 0.01 --miu 0.02 --opt "AdamW"
python train_wd_regular.py --net "vit_tiny" --set_seed 0 --save_net "vit_tiny_default_bn_freeze_no_const_AdamW_lr_0.001" --plot_path "./images/wd_reg" --imgs 500,5000 --resolution 100 --epochs 200 --lr 0.001 --lambda_reg 0.01 --miu 0.02 --opt "AdamW"

python test.py  --net 'vit_tiny' --set_seed 0 --load_net './saved_models/wd_reg/0/vit_tiny_default_AdamW_lr_0.001_no_reg/vit_tiny_default_AdamW_lr_0.001_no_reg.pth' --epochs 400  --resolution 100 --imgs 500,5000
python test.py  --net 'vit_tiny' --set_seed 0 --load_net './saved_models/wd_reg/0/vit_tiny_default_bn_freeze_no_const_AdamW_lr_0.001/vit_tiny_default_bn_freeze_no_const_AdamW_lr_0.001.pth' --epochs 400  --resolution 100 --imgs 500,5000

python test.py  --net 'resnet' --set_seed 0 --load_net './saved_models/wd_reg/0/resnet_default_bn_freeze_no_const_AdamW_lr_0.001_lambda_0.001/resnet_default_bn_freeze_no_const_AdamW_lr_0.001_lambda_0.001.pth' --epochs 400  --resolution 100 --imgs 500,5000
python test.py  --net 'resnet' --set_seed 0 --load_net './saved_models/wd_reg/0/resnet_default_no_reg_AdamW_lr_0.001/resnet_default_no_reg_AdamW_lr_0.001.pth' --epochs 400  --resolution 100 --imgs 500,5000

python ./poly/weighted_degree.py  --net 'vit_tiny' --set_seed 0 --load_net './saved_models/wd_reg/0/big_reg/vit_tiny_aug_AdamW_lr_0.001_reg0.01_0.pth' --epochs 400  --resolution 100 --imgs 500,5000
python ./poly/weighted_degree.py  --net 'vit_tiny' --set_seed 0 --load_net './saved_models/wd_reg/0/big_reg/vit_tiny_aug_AdamW_lr_0.001_reg0.01.pth' --epochs 400  --resolution 100 --imgs 500,5000
python ./poly/weighted_degree.py  --net 'vit_tiny' --set_seed 0 --load_net './saved_models/wd_reg/0/big_reg/standard.pth' --epochs 400  --resolution 100 --imgs 500,5000
python ./poly/weighted_degree.py  --net 'vit_tiny' --set_seed 0 --load_net './saved_models/wd_reg/0/big_reg/standard_0.pth' --epochs 400  --resolution 100 --imgs 500,5000

python ./poly/weighted_degree.py  --net 'vit_tiny_no_drop_out' --set_seed 0 --load_net './saved_models/wd_reg/0/big_reg/negative_reg_no_dropout_0.pth' --epochs 400  --resolution 100 --imgs 500,5000
python ./poly/weighted_degree.py  --net 'vit_tiny_no_drop_out' --set_seed 0 --load_net './saved_models/wd_reg/0/big_reg/negative_reg_no_dropout.pth' --epochs 400  --resolution 100 --imgs 500,5000
python ./poly/weighted_degree.py  --net 'vit_tiny_no_drop_out' --set_seed 0 --load_net './saved_models/wd_reg/0/big_reg/standard_no_dropout.pth' --epochs 400  --resolution 100 --imgs 500,5000
python ./poly/weighted_degree.py  --net 'vit_tiny_no_drop_out' --set_seed 0 --load_net './saved_models/wd_reg/0/big_reg/standard_no_dropout_0.pth' --epochs 400  --resolution 100 --imgs 500,5000

python train_wd_regular.py --net "vit_tiny_no_drop_out" --set_seed 0 --save_net "vit_tiny_no_drop_out_bn_freeze_no_const_AdamW_lr_0.001" --plot_path "./images/wd_reg" --imgs 500,5000 --resolution 100 --epochs 300 --lr 0.001 --lambda_reg 0.001 --miu 0.02 --opt "AdamW" --use_data_aug
python ./poly/weighted_degree.py  --net 'vit_tiny_no_drop_out' --set_seed 0 --load_net './saved_models/wd_reg/0/vit_tiny_no_drop_out_neg_reg_bn_freeze_no_const_AdamW_lr_0.001/vit_tiny_no_drop_out_neg_reg_bn_freeze_no_const_AdamW_lr_0.001_299.pth' --epochs 400  --resolution 100 --imgs 500,5000


# layer reg
python train_single_block.py --net "vit_single" --set_seed 0 --save_net "vit_single_layer_reg" --plot_path "./images/wd_reg" --imgs 500,5000 --resolution 100 --epochs 200 --lr 0.001 --lambda_reg 0.01 --miu 0.02 --opt "AdamW"
python train_single_block.py --net "vit_single" --set_seed 0 --save_net "vit_single_layer_reg_mean" --plot_path "./images/wd_reg" --imgs 500,5000 --resolution 100 --epochs 200 --lr 0.001 --lambda_reg 0.01 --miu 0.02 --opt "AdamW"
python train_single_block.py --net "vit_single" --set_seed 0 --save_net "vit_single_layer_no_reg" --plot_path "./images/wd_reg" --imgs 500,5000 --resolution 100 --epochs 200 --lr 0.001 --lambda_reg -1 --miu 0.02 --opt "AdamW"

python polynet.py --set_seed 0 --resolution 500 --epochs 200 --lr 0.001 --bs 32
python train_single_block.py --net "vit_single" --set_seed 0 --save_net "vit_single_layer_only_reg_mean" --plot_path "./images/wd_reg" --imgs 500,5000 --resolution 100 --epochs 200 --lr 0.001 --lambda_reg 0.01 --miu 0.02 --opt "AdamW"
python train_single_block.py --net "vit_single" --set_seed 0 --save_net "vit_single_layer_only_reg_mean_test" --plot_path "./images/wd_reg" --imgs 500,5000 --resolution 100 --epochs 200 --lr 0.001 --lambda_reg 0.01 --miu 0.02 --opt "AdamW"

python test_input_feature.py --net "vit_single"

python test.py  --net 'vit_single' --set_seed 0 --load_net './saved_models/wd_reg/0/vit_single_layer_only_reg_mean/vit_single_layer_only_reg_mean_199.pth' --epochs 400  --resolution 100 --imgs 500,5000
python test.py  --net 'vit_single' --set_seed 0 --load_net './saved_models/wd_reg/0/vit_single_layer_reg_mean/vit_single_layer_reg_mean_199.pth' --epochs 400  --resolution 100 --imgs 500,5000
python test.py  --net 'vit_single' --set_seed 0 --load_net './saved_models/wd_reg/0/vit_single_layer_no_reg/vit_single_layer_no_reg_199.pth' --epochs 400  --resolution 100 --imgs 500,5000
python train_wd_regular.py --net "vit_tiny" --set_seed 0 --save_net "vit_tiny_default_no_const_AdamW_lr_0.001" --plot_path "./images/wd_reg" --imgs 500,5000 --resolution 100 --lr 0.001 --lambda_reg 0.01 --miu 0.02 --opt "AdamW"
python train_wd_regular.py --net "vit_tiny" --set_seed 0 --save_net "vit_tiny_default_no_reg_new_AdamW_lr_0.001" --plot_path "./images/wd_reg" --imgs 500,5000 --resolution 100 --lr 0.001 --lambda_reg -1 --miu 0.02 --opt "AdamW"
python train_wd_regular.py --net "vit_tiny" --set_seed 0 --save_net "vit_tiny_default_have_const_AdamW_lr_0.001" --plot_path "./images/wd_reg" --imgs 500,5000 --resolution 100 --lr 0.001 --lambda_reg 0.01 --miu 0.02 --opt "AdamW" --have_const

python train_single_block.py --net "vit_tiny" --set_seed 0 --save_net "vit_tiny_layer_reg" --plot_path "./images/wd_reg" --imgs 500,5000 --resolution 100 --lr 0.001 --lambda_reg 0.01 --miu 0.02 --opt "AdamW"

python train_wd_regular.py --net "vit_tiny_no_drop_out" --set_seed 0 --save_net "vit_tiny_no_drop_out_reg" --plot_path "./images/wd_reg" --imgs 500,5000 --resolution 100 --lambda_reg 0.01 --miu 0.02 --opt "AdamW"
python train_wd_regular.py --net "vit_tiny_no_drop_out" --set_seed 0 --save_net "vit_tiny_no_drop_out_no_reg" --plot_path "./images/wd_reg" --imgs 500,5000 --resolution 100 --lambda_reg -1 --miu 0.02 --opt "AdamW"
python train_single_block.py --net "vit_tiny_no_drop_out" --set_seed 0 --save_net "vit_tiny_no_drop_out_layer_reg" --plot_path "./images/wd_reg" --imgs 500,5000 --resolution 100 --lambda_reg 0.01 --miu 0.02 --opt "AdamW"

# aug
python train_single_block.py --net "vit_single" --set_seed 0 --save_net "vit_single_layer_reg_aug" --plot_path "./images/wd_reg" --imgs 500,5000 --resolution 100 --epochs 200 --lr 0.001 --lambda_reg 0.01 --miu 0.02 --opt "AdamW" --use_data_aug
python train_single_block.py --net "vit_single" --set_seed 0 --save_net "vit_single_layer_no_reg_aug" --plot_path "./images/wd_reg" --imgs 500,5000 --resolution 100 --epochs 200 --lr 0.001 --lambda_reg -1 --miu 0.02 --opt "AdamW" --use_data_aug

python train_wd_regular.py --net "vit_tiny" --set_seed 0 --save_net "vit_tiny_reg_aug" --plot_path "./images/wd_reg" --imgs 500,5000 --resolution 100 --lambda_reg 0.01 --miu 0.02 --opt "AdamW" --use_data_aug
python train_wd_regular.py --net "vit_tiny" --set_seed 0 --save_net "vit_tiny_no_reg_aug" --plot_path "./images/wd_reg" --imgs 500,5000 --resolution 100 --lambda_reg -1 --miu 0.02 --opt "AdamW" --use_data_aug
python train_single_block.py --net "vit_tiny" --set_seed 0 --save_net "vit_tiny_layer_reg_aug" --plot_path "./images/wd_reg" --imgs 500,5000 --resolution 100 --lambda_reg 0.01 --miu 0.02 --opt "AdamW" --use_data_aug

python ./poly/weighted_degree.py --net "vit_tiny" --set_seed 0 --load_net './saved_models/wd_reg/0/vit_tiny_default_no_reg_new_AdamW_lr_0.001/vit_tiny_default_no_reg_new_AdamW_lr_0.001.pth' --epochs 400  --resolution 200 --imgs 500,5000
python ./poly/weighted_degree.py --net "vit_tiny" --set_seed 0 --load_net './saved_models/wd_reg/0/vit_tiny_default_no_const_AdamW_lr_0.001/vit_tiny_default_no_const_AdamW_lr_0.001.pth' --epochs 400  --resolution 200 --imgs 500,5000
python ./poly/weighted_degree.py --net "vit_tiny" --set_seed 0 --load_net './saved_models/wd_reg/0/vit_tiny_layer_reg/vit_tiny_layer_reg.pth' --epochs 400  --resolution 200 --imgs 500,5000

python train_single_block.py --net "vit_tiny" --set_seed 0 --save_net "vit_tiny_layer_reg_45" --plot_path "./images/wd_reg" --imgs 500,5000 --resolution 100 --lambda_reg 0.01 --miu 0.02 --opt "AdamW" --reg_layers 4 5
python train_single_block.py --net "vit_tiny" --set_seed 0 --save_net "vit_tiny_layer_reg_5" --plot_path "./images/wd_reg" --imgs 500,5000 --resolution 100 --lambda_reg 0.01 --miu 0.02 --opt "AdamW" --reg_layers 5

# visualize loss
python test.py  --net 'vit_tiny' --set_seed 0 --load_net './saved_models/wd_reg/0/vit_tiny_default_no_reg_new_AdamW_lr_0.001/vit_tiny_default_no_reg_new_AdamW_lr_0.001.pth' --epochs 400  --resolution 100 --imgs 500,5000
python test.py  --net 'vit_tiny' --set_seed 0 --load_net './saved_models/wd_reg/0/vit_tiny_default_have_const_AdamW_lr_0.001/vit_tiny_default_have_const_AdamW_lr_0.001.pth' --epochs 400  --resolution 100 --imgs 500,5000
python test.py  --net 'vit_tiny' --set_seed 0 --load_net './saved_models/wd_reg/0/vit_tiny_default_no_const_AdamW_lr_0.001/vit_tiny_default_no_const_AdamW_lr_0.001.pth' --epochs 400  --resolution 100 --imgs 500,5000


# ae
python ./AutoEncoder/train.py
python ./AutoEncoder/test.py

# PCA
python ./poly/weighted_degree_PCA.py --net 'resnet' --set_seed 0 --load_net './saved_models/no_aug/resnet_new_42/resnet_lr0_1_bs256_wd1e-5.pth'

# softmax
python train_wd_regular.py --net "vit_tiny" --set_seed 0 --save_net "vit_tiny_default_softmax_AdamW_lr_0.001" --plot_path "./images/wd_reg" --imgs 500,5000 --resolution 100 --lr 0.001 --lambda_reg 0.01 --miu 0.02 --opt "AdamW"

python ./poly/weighted_degree.py --net "vit_tiny" --set_seed 0 --load_net './saved_models/wd_reg/0/vit_tiny_default_softmax_AdamW_lr_0.001/vit_tiny_default_softmax_AdamW_lr_0.001.pth' --epochs 400  --resolution 200 --imgs 500,5000
python ./poly/weighted_degree.py --net "vit_tiny" --set_seed 0 --load_net './saved_models/wd_reg/0/vit_tiny_default_no_reg_new_AdamW_lr_0.001/vit_tiny_default_no_reg_new_AdamW_lr_0.001.pth' --epochs 400  --resolution 200 --imgs 500,5000
python ./poly/weighted_degree.py --net "vit_tiny" --set_seed 0 --load_net './saved_models/wd_reg/0/vit_tiny_default_no_const_AdamW_lr_0.001/vit_tiny_default_no_const_AdamW_lr_0.001.pth' --epochs 400  --resolution 200 --imgs 500,5000

python train_wd_regular.py --net "vit_tiny" --set_seed 0 --save_net "vit_tiny_softmax_AdamW_lr_0.001_lambda_0.05" --plot_path "./images/wd_reg" --imgs 500,5000 --resolution 100 --lr 0.001 --lambda_reg 0.05 --miu 0.02 --opt "AdamW"
python train_wd_regular.py --net "vit_tiny" --set_seed 0 --save_net "vit_tiny_softmax_AdamW_lr_0.001_lambda_0.1" --plot_path "./images/wd_reg" --imgs 500,5000 --resolution 100 --lr 0.001 --lambda_reg 0.1 --miu 0.02 --opt "AdamW"


python test.py  --net 'vit_tiny' --set_seed 0 --load_net './saved_models/wd_reg/0/vit_tiny_default_no_reg_new_AdamW_lr_0.001/vit_tiny_default_no_reg_new_AdamW_lr_0.001.pth' --epochs 400  --resolution 100 --imgs 500,5000
python test.py  --net 'vit_tiny' --set_seed 0 --load_net './saved_models/wd_reg/0/vit_tiny_default_softmax_AdamW_lr_0.001/vit_tiny_default_softmax_AdamW_lr_0.001.pth' --epochs 400  --resolution 100 --imgs 500,5000

python train_wd_regular.py --net "vit_tiny" --set_seed 0 --save_net "vit_tiny_aug_softmax_AdamW_lr_0.001" --plot_path "./images/wd_reg" --imgs 500,5000 --resolution 100 --lr 0.001 --lambda_reg 0.01 --miu 0.02 --opt "AdamW" --use_data_aug
python train_wd_regular.py --net "vit_tiny" --set_seed 0 --save_net "vit_tiny_aug_softmax_AdamW_lr_0.001_no_reg" --plot_path "./images/wd_reg" --imgs 500,5000 --resolution 100 --lr 0.001 --lambda_reg -1 --miu 0.02 --opt "AdamW" --use_data_aug
python train_wd_regular.py --net "vit_tiny" --set_seed 0 --save_net "vit_tiny_aug_softmax_AdamW_lr_0.001_no_miu" --plot_path "./images/wd_reg" --imgs 500,5000 --resolution 100 --lr 0.001 --lambda_reg 0.01 --opt "AdamW" --use_data_aug
python train_wd_regular.py --net "vit_tiny" --set_seed 0 --save_net "vit_tiny_aug_softmax_AdamW_lr_0.001_lambda_0.05" --plot_path "./images/wd_reg" --imgs 500,5000 --resolution 100 --lr 0.001 --lambda_reg 0.05 --opt "AdamW" --use_data_aug

python train_wd_regular.py --net "vit_tiny" --set_seed 0 --save_net "vit_tiny_softmax_AdamW_lr_0.001_lambda_0.05_no_miu" --plot_path "./images/wd_reg" --imgs 500,5000 --resolution 100 --lr 0.001 --lambda_reg 0.05 --opt "AdamW"
python train_wd_regular.py --net "vit_tiny" --set_seed 0 --save_net "vit_tiny_aug_softmax_AdamW_lr_0.001_lambda_0.1" --plot_path "./images/wd_reg" --imgs 500,5000 --resolution 100 --lr 0.001 --lambda_reg 0.1 --opt "AdamW" --use_data_aug

python train_wd_regular.py --net "vit_tiny" --set_seed 0 --save_net "vit_tiny_default_softmax_AdamW_lr_0.001_no_miu" --plot_path "./images/wd_reg" --imgs 500,5000 --resolution 100 --lr 0.001 --lambda_reg 0.01 --opt "AdamW"

python test.py  --net 'vit_tiny' --set_seed 0 --load_net './saved_models/wd_reg/0/vit_tiny_softmax_AdamW_lr_0.001_lambda_0.05/vit_tiny_softmax_AdamW_lr_0.001_lambda_0.05.pth' --epochs 400  --resolution 100 --imgs 500,5000
python test.py  --net 'vit_tiny' --set_seed 0 --load_net './saved_models/wd_reg/0/vit_tiny_softmax_AdamW_lr_0.001_lambda_0.1/vit_tiny_softmax_AdamW_lr_0.001_lambda_0.1.pth' --epochs 400  --resolution 100 --imgs 500,5000
python test.py  --net 'vit_tiny' --set_seed 0 --load_net './saved_models/wd_reg/0/vit_tiny_aug_AdamW_lr_0.001_no_reg/vit_tiny_aug_AdamW_lr_0.001_no_reg.pth' --epochs 400  --resolution 100 --imgs 500,5000
python test.py  --net 'vit_tiny' --set_seed 0 --load_net './saved_models/wd_reg/0/vit_tiny_aug_softmax_AdamW_lr_0.001/vit_tiny_aug_softmax_AdamW_lr_0.001.pth' --epochs 400  --resolution 100 --imgs 500,5000

python ./poly/weighted_degree.py --net "vit_tiny" --set_seed 0 --load_net './saved_models/wd_reg/0/vit_tiny_softmax_AdamW_lr_0.001_lambda_0.05/vit_tiny_softmax_AdamW_lr_0.001_lambda_0.05.pth' --epochs 400  --resolution 200 --imgs 500,5000


# optimize code
python train_wd_regular.py --net "vit_tiny" --set_seed 0 --save_net "vit_tiny_test_softmax_AdamW_lr_0.001_lambda_0.05" --plot_path "./images/wd_reg" --imgs 500,5000 --resolution 100 --lr 0.001 --lambda_reg 0.05 --opt "AdamW"
python train_wd_regular.py --net "vit_tiny" --set_seed 0 --save_net "vit_tiny_test_pairs_softmax_AdamW_lr_0.001_lambda_0.05" --plot_path "./images/wd_reg" --imgs 500,5000 --resolution 100 --lr 0.001 --lambda_reg 0.05 --opt "AdamW" --nums_pairs 2
python train_wd_regular.py --net "vit_tiny" --set_seed 0 --save_net "vit_tiny_test_pairs_20_softmax_AdamW_lr_0.001_lambda_0.05" --plot_path "./images/wd_reg" --imgs 500,5000 --resolution 100 --lr 0.001 --lambda_reg 0.05 --opt "AdamW" --nums_pairs 20
python train_wd_regular.py --net "vit_tiny" --set_seed 0 --save_net "vit_tiny_test_pairs_1_softmax_AdamW_lr_0.001_lambda_0.05" --plot_path "./images/wd_reg" --imgs 500,5000 --resolution 100 --lr 0.001 --lambda_reg 0.05 --opt "AdamW"


# viz aug
python ./poly/weighted_degree.py --net "vit_tiny" --set_seed 0 --load_net './saved_models/wd_reg/0/vit_tiny_aug_softmax_AdamW_lr_0.001_no_reg/vit_tiny_aug_softmax_AdamW_lr_0.001_no_reg.pth' --epochs 400  --resolution 200 --imgs 500,5000
python ./poly/weighted_degree.py --net "vit_tiny" --set_seed 0 --load_net './saved_models/wd_reg/0/vit_tiny_aug_softmax_AdamW_lr_0.001_no_miu/vit_tiny_aug_softmax_AdamW_lr_0.001_no_miu.pth' --epochs 400  --resolution 200 --imgs 500,5000

python test.py  --net 'vit_tiny' --set_seed 0 --load_net './saved_models/wd_reg/0/vit_tiny_aug_softmax_AdamW_lr_0.001_no_reg/vit_tiny_aug_softmax_AdamW_lr_0.001_no_reg.pth' --epochs 400  --resolution 100 --imgs 500,5000
python test.py  --net 'vit_tiny' --set_seed 0 --load_net './saved_models/wd_reg/0/vit_tiny_aug_softmax_AdamW_lr_0.001_no_miu/vit_tiny_aug_softmax_AdamW_lr_0.001_no_miu.pth' --epochs 400  --resolution 100 --imgs 500,5000

python train_wd_regular.py --net "vit_tiny" --set_seed 0 --save_net "vit_tiny_pairs_2_softmax_AdamW_lr_0.001_lambda_0.1" --plot_path "./images/wd_reg" --imgs 500,5000 --resolution 100 --lr 0.001 --lambda_reg 0.1 --opt "AdamW" --nums_pairs 2
python train_wd_regular.py --net "vit_tiny" --set_seed 0 --save_net "vit_tiny_pairs_8_softmax_AdamW_lr_0.001_lambda_0.4" --plot_path "./images/wd_reg" --imgs 500,5000 --resolution 100 --lr 0.001 --lambda_reg 0.4 --opt "AdamW" --nums_pairs 8
python train_wd_regular.py --net "vit_tiny" --set_seed 0 --save_net "vit_tiny_pairs_4_softmax_AdamW_lr_0.001_lambda_0.2" --plot_path "./images/wd_reg" --imgs 500,5000 --resolution 100 --lr 0.001 --lambda_reg 0.2 --opt "AdamW" --nums_pairs 4

# 1 pair test lambda
python train_wd_regular.py --net "vit_tiny" --set_seed 0 --save_net "vit_tiny_pairs_1_softmax_AdamW_lr_0.001_lambda_0.02" --plot_path "./images/wd_reg" --imgs 500,5000 --resolution 100 --lr 0.001 --lambda_reg 0.02 --opt "AdamW"
python train_wd_regular.py --net "vit_tiny" --set_seed 0 --save_net "vit_tiny_pairs_1_softmax_AdamW_lr_0.001_lambda_0.03" --plot_path "./images/wd_reg" --imgs 500,5000 --resolution 100 --lr 0.001 --lambda_reg 0.03 --opt "AdamW"


# viz
python ./poly/wd_plot.py --net "vit_tiny" --set_seed 0 --load_net './saved_models/wd_reg/0/vit_tiny_default_no_reg_new_AdamW_lr_0.001/vit_tiny_default_no_reg_new_AdamW_lr_0.001.pth' --epochs 400  --resolution 200 --imgs 500,5000

# finetune
python finetune.py --net "vit_tiny" --set_seed 0 --save_net "vit_tiny_finetune_lr_0.0001_lambda_0.05_aug_epoch50" --plot_path "./images/wd_reg" --imgs 500,5000 --resolution 100 --lr 0.0001 --lambda_reg 0.05 --opt "AdamW" --epochs 50 --load_net './saved_models/wd_reg/0/vit_tiny_aug_softmax_AdamW_lr_0.001_no_reg/vit_tiny_aug_softmax_AdamW_lr_0.001_no_reg.pth' --use_data_aug

# lambda warm up
python train_wd_regular.py --net "vit_tiny" --set_seed 0 --save_net "vit_tiny_aug_softmax_AdamW_lr_0.001_lambda_0.05_lambda_warmup_50" --plot_path "./images/wd_reg" --imgs 500,5000 --resolution 100 --lr 0.001 --lambda_reg 0.05 --opt "AdamW" --use_data_aug --warmup_epochs_for_lambda 50

python train_wd_regular.py --net "vit_tiny" --set_seed 0 --save_net "vit_tiny_aug_softmax_AdamW_lr_0.001_lambda_0.04_lambda_warmup_50" --plot_path "./images/wd_reg" --imgs 500,5000 --resolution 100 --lr 0.001 --lambda_reg 0.04 --opt "AdamW" --use_data_aug --warmup_epochs_for_lambda 50 --have_const
python train_wd_regular.py --net "vit_tiny" --set_seed 0 --save_net "vit_tiny_aug_softmax_AdamW_lr_0.001_lambda_0.03_lambda_warmup_50" --plot_path "./images/wd_reg" --imgs 500,5000 --resolution 100 --lr 0.001 --lambda_reg 0.03 --opt "AdamW" --use_data_aug --warmup_epochs_for_lambda 50 --have_const
python train_wd_regular.py --net "vit_tiny" --set_seed 0 --save_net "vit_tiny_aug_softmax_AdamW_lr_0.001_lambda_0.02_lambda_warmup_50" --plot_path "./images/wd_reg" --imgs 500,5000 --resolution 100 --lr 0.001 --lambda_reg 0.02 --opt "AdamW" --use_data_aug --warmup_epochs_for_lambda 50 --have_const

python ./poly/wd_plot.py --net "vit_tiny" --set_seed 0 --load_net './saved_models/wd_reg/0/vit_tiny_finetune_lr_0.0001_lambda_0.05_aug_epoch50/vit_tiny_finetune_lr_0.0001_lambda_0.05_aug_epoch50_49.pth' --epochs 100  --resolution 200 --imgs 500,5000

python train_wd_regular.py --net "vit_tiny" --set_seed 0 --save_net "vit_tiny_aug_softmax_label_AdamW_lr_0.001_lambda_0.05_lambda_warmup_50" --plot_path "./images/wd_reg" --imgs 500,5000 --resolution 100 --lr 0.001 --lambda_reg 0.05 --opt "AdamW" --use_data_aug --warmup_epochs_for_lambda 50 --have_const --label

python train_wd_regular.py --net "vit_tiny" --set_seed 0 --save_net "vit_tiny_raw" --plot_path "./images/wd_reg" --imgs 500,5000 --resolution 100 --lr 0.001 --lambda_reg 0.05 --opt "AdamW" --epochs 0

python ./poly/wd_plot.py --net "vit_tiny" --set_seed 0 --load_net './saved_models/wd_reg/0/vit_tiny_raw/vit_tiny_raw.pth' --epochs 100  --resolution 200 --imgs 500,5000

python test.py  --net 'vit_tiny' --set_seed 0 --load_net './saved_models/wd_reg/0/vit_tiny_raw/vit_tiny_raw.pth' --epochs 400  --resolution 100 --imgs 500,5000

python ./poly/wd_plot.py --net "vit_tiny" --set_seed 0 --load_net './saved_models/wd_reg/0/vit_tiny_aug_softmax_label_AdamW_lr_0.001_lambda_0.05_lambda_warmup_50/vit_tiny_aug_softmax_label_AdamW_lr_0.001_lambda_0.05_lambda_warmup_50.pth' --epochs 100  --resolution 200 --imgs 500,5000

python train_wd_regular.py --net "vit_tiny" --set_seed 0 --save_net "vit_tiny_aug_softmax_label_new_AdamW_lr_0.001_lambda_0.05_lambda_warmup_50" --plot_path "./images/wd_reg" --imgs 500,5000 --resolution 100 --lr 0.001 --lambda_reg 0.05 --opt "AdamW" --use_data_aug --warmup_epochs_for_lambda 50 --have_const --label

python train_wd_regular.py --net "vit_tiny" --set_seed 0 --save_net "vit_tiny_aug_softmax_AdamW_lr_0.001_lambda_0.05_lambda_warmup_50_no_norm" --plot_path "./images/wd_reg" --imgs 500,5000 --resolution 100 --lr 0.001 --lambda_reg 0.05 --opt "AdamW" --use_data_aug --warmup_epochs_for_lambda 50 --have_const
# smooth
python train_wd_regular.py --net "vit_tiny" --set_seed 0 --save_net "vit_tiny_aug_softmax_AdamW_lr_0.001_lambda_0.05_lambda_warmup_50_no_norm_smooth" --plot_path "./images/wd_reg" --imgs 500,5000 --resolution 100 --lr 0.001 --lambda_reg 0.05 --opt "AdamW" --use_data_aug --warmup_epochs_for_lambda 50 --have_const --smooth


python ./poly/wd_plot.py --net "vit_tiny" --set_seed 0 --load_net './saved_models/wd_reg/0/vit_tiny_aug_softmax_AdamW_lr_0.001_lambda_0.05_lambda_warmup_50_no_norm/vit_tiny_aug_softmax_AdamW_lr_0.001_lambda_0.05_lambda_warmup_50_no_norm.pth' --epochs 100  --resolution 200 --imgs 500,5000

python train_wd_regular.py --net "vit_tiny" --set_seed 0 --save_net "vit_tiny_aug_softmax_AdamW_lr_0.001_lambda_0.05_lambda_warmup_50_no_norm_pairs_2" --plot_path "./images/wd_reg" --imgs 500,5000 --resolution 100 --lr 0.001 --lambda_reg 0.05 --opt "AdamW" --use_data_aug --warmup_epochs_for_lambda 50 --have_const --nums_pairs 2

python train_wd_regular.py --net "vit_tiny" --set_seed 0 --save_net "vit_tiny_aug_softmax_AdamW_lr_0.001_lambda_0.05_lambda_warmup_50_no_norm_0,1" --plot_path "./images/wd_reg" --imgs 500,5000 --resolution 100 --lr 0.001 --lambda_reg 0.05 --opt "AdamW" --use_data_aug --warmup_epochs_for_lambda 50

python test.py  --net 'vit_tiny' --set_seed 0 --load_net './saved_models/wd_reg/0/vit_tiny_aug_softmax_AdamW_lr_0.001_lambda_0.05_lambda_warmup_50_no_norm/vit_tiny_aug_softmax_AdamW_lr_0.001_lambda_0.05_lambda_warmup_50_no_norm.pth' --epochs 400  --resolution 100 --imgs 500,5000
python test.py  --net 'vit_tiny' --set_seed 0 --load_net './saved_models/wd_reg/0/vit_tiny_aug_softmax_AdamW_lr_0.001_lambda_0.05_lambda_warmup_50_no_norm_0,1/vit_tiny_aug_softmax_AdamW_lr_0.001_lambda_0.05_lambda_warmup_50_no_norm_0,1.pth' --epochs 400  --resolution 100 --imgs 500,5000

python ./poly/weighted_degree_2d.py --net "vit_tiny" --set_seed 0 --load_net './saved_models/wd_reg/0/vit_tiny_aug_softmax_AdamW_lr_0.001_no_reg/vit_tiny_aug_softmax_AdamW_lr_0.001_no_reg.pth' --epochs 200  --resolution 10 --imgs 500,5000 --max_degree 6
python ./poly/weighted_degree_2d.py --net "vit_tiny" --set_seed 0 --load_net './saved_models/wd_reg/0/vit_tiny_aug_softmax_AdamW_lr_0.001_lambda_0.05_lambda_warmup_50_no_norm/vit_tiny_aug_softmax_AdamW_lr_0.001_lambda_0.05_lambda_warmup_50_no_norm.pth' --epochs 200  --resolution 20 --imgs 500,5000 --max_degree 10
python ./poly/weighted_degree_2d.py --net "vit_tiny" --set_seed 0 --load_net './saved_models/wd_reg/0/vit_tiny_aug_softmax_AdamW_lr_0.001_lambda_0.05_lambda_warmup_50/vit_tiny_aug_softmax_AdamW_lr_0.001_lambda_0.05_lambda_warmup_50.pth' --epochs 200  --resolution 20 --imgs 500,5000 --max_degree 10

python train_wd_regular_2d.py --net "vit_tiny" --set_seed 0 --save_net "vit_tiny_aug_2d_AdamW_lr_0.001_lambda_0.05_lambda_warmup_50_no_norm" --plot_path "./images/wd_reg" --imgs 500,5000 --resolution 10 --max_degree 7 --lr 0.001 --lambda_reg 0.05 --opt "AdamW" --use_data_aug --warmup_epochs_for_lambda 50
python train_wd_regular_2d.py --net "vit_tiny" --set_seed 0 --save_net "vit_tiny_aug_2d_only_reg" --plot_path "./images/wd_reg" --imgs 500,5000 --resolution 10 --max_degree 7 --lr 0.001 --lambda_reg 0.05 --opt "AdamW" --use_data_aug --warmup_epochs_for_lambda 50

python train_wd_regular.py --net "vit_tiny" --set_seed 0 --save_net "vit_tiny_pairs_3_follow" --plot_path "./images/wd_reg" --imgs 500,5000 --lr 0.005 --lambda_reg 0.01 --opt "AdamW" --epochs 300 --resolution 100 --use_data_aug --nums_pairs 3 --label
python train_wd_regular.py --net "vit_tiny" --set_seed 0 --save_net "vit_tiny_pairs_3_normal" --plot_path "./images/wd_reg" --imgs 500,5000 --lr 0.001 --lambda_reg 0.05 --opt "AdamW" --epochs 300 --resolution 100 --use_data_aug --nums_pairs 3 --label

python train_wd_regular.py --net "vit_tiny" --set_seed 0 --save_net "vit_tiny_pairs_4_label" --plot_path "./images/wd_reg" --imgs 500,5000 --lr 0.001 --lambda_reg 0.05 --opt "AdamW" --epochs 300 --resolution 100 --use_data_aug --nums_pairs 4 --label
python train_wd_regular.py --net "vit_tiny" --set_seed 0 --save_net "vit_tiny_pairs_8_label" --plot_path "./images/wd_reg" --imgs 500,5000 --lr 0.001 --lambda_reg 0.05 --opt "AdamW" --epochs 300 --resolution 100 --use_data_aug --nums_pairs 8 --label
python train_wd_regular.py --net "vit_tiny" --set_seed 0 --save_net "vit_tiny_pairs_16_label" --plot_path "./images/wd_reg" --imgs 500,5000 --lr 0.001 --lambda_reg 0.05 --opt "AdamW" --epochs 300 --resolution 100 --use_data_aug --nums_pairs 16 --label

python train_wd_regular.py --net "vit_tiny" --set_seed 0 --save_net "vit_tiny_pairs_3_follow_sin" --plot_path "./images/wd_reg" --imgs 500,5000 --lr 0.005 --lambda_reg 0.01 --opt "AdamW" --epochs 300 --resolution 100 --use_data_aug --nums_pairs 3 --label --warmup_epochs_for_lambda 100
python train_wd_regular.py --net "vit_tiny" --set_seed 0 --save_net "vit_tiny_pairs_3_follow_linear50" --plot_path "./images/wd_reg" --imgs 500,5000 --lr 0.005 --lambda_reg 0.01 --opt "AdamW" --epochs 300 --resolution 100 --use_data_aug --nums_pairs 3 --label --warmup_epochs_for_lambda 50
python train_wd_regular.py --net "vit_tiny" --set_seed 0 --save_net "vit_tiny_aug_no_reg_lr_0.005" --plot_path "./images/wd_reg" --imgs 500,5000 --lr 0.005 --lambda_reg -1 --opt "AdamW" --epochs 300 --resolution 100 --use_data_aug

python train_wd_regular.py --net "vit_tiny" --set_seed 0 --save_net "vit_tiny_pairs_3_follow_linear50_lambda_0.05" --plot_path "./images/wd_reg" --imgs 500,5000 --lr 0.005 --lambda_reg 0.05 --opt "AdamW" --epochs 300 --resolution 100 --use_data_aug --nums_pairs 3 --label --warmup_epochs_for_lambda 50
python train_wd_regular.py --net "vit_tiny" --set_seed 0 --save_net "vit_tiny_pairs_4_follow_linear50" --plot_path "./images/wd_reg" --imgs 500,5000 --lr 0.005 --lambda_reg 0.01 --opt "AdamW" --epochs 300 --resolution 100 --use_data_aug --nums_pairs 4 --label --warmup_epochs_for_lambda 50
python train_wd_regular.py --net "vit_tiny" --set_seed 0 --save_net "vit_tiny_pairs_6_follow_linear50" --plot_path "./images/wd_reg" --imgs 500,5000 --lr 0.005 --lambda_reg 0.01 --opt "AdamW" --epochs 300 --resolution 100 --use_data_aug --nums_pairs 6 --label --warmup_epochs_for_lambda 50

python train_wd_regular.py --net "vit_tiny" --set_seed 0 --save_net "vit_tiny_pairs_3_follow_linear50_lambda_0.03" --plot_path "./images/wd_reg" --imgs 500,5000 --lr 0.005 --lambda_reg 0.03 --opt "AdamW" --epochs 300 --resolution 100 --use_data_aug --nums_pairs 3 --label --warmup_epochs_for_lambda 50
python train_wd_regular.py --net "vit_tiny" --set_seed 0 --save_net "vit_tiny_pairs_3_follow_linear50_lambda_0.02" --plot_path "./images/wd_reg" --imgs 500,5000 --lr 0.005 --lambda_reg 0.02 --opt "AdamW" --epochs 300 --resolution 100 --use_data_aug --nums_pairs 3 --label --warmup_epochs_for_lambda 50

python train_wd_regular.py --net "vit_tiny" --set_seed 0 --save_net "vit_tiny_pairs_3_follow_sin_01" --plot_path "./images/wd_reg" --imgs 500,5000 --lr 0.005 --lambda_reg 0.01 --opt "AdamW" --epochs 300 --resolution 100 --use_data_aug --nums_pairs 3 --label --warmup_epochs_for_lambda 100
python train_wd_regular.py --net "vit_tiny" --set_seed 0 --save_net "vit_tiny_pairs_3_follow_linear50_01" --plot_path "./images/wd_reg" --imgs 500,5000 --lr 0.005 --lambda_reg 0.01 --opt "AdamW" --epochs 300 --resolution 100 --use_data_aug --nums_pairs 3 --label --warmup_epochs_for_lambda 50

python train_wd_regular.py --net "vit_tiny" --set_seed 0 --save_net "vit_tiny_pairs_3_follow_linear50_lambda_0.02_01" --plot_path "./images/wd_reg" --imgs 500,5000 --lr 0.005 --lambda_reg 0.02 --opt "AdamW" --epochs 300 --resolution 100 --use_data_aug --nums_pairs 3 --label --warmup_epochs_for_lambda 100

python train_wd_regular.py --net "vit_tiny" --set_seed 0 --save_net "vit_tiny_pairs_3_follow_sin_01_xxx_env" --plot_path "./images/wd_reg" --imgs 500,5000 --lr 0.005 --lambda_reg 0.01 --opt "AdamW" --epochs 300 --resolution 100 --use_data_aug --nums_pairs 3 --label --warmup_epochs_for_lambda 100
python train_wd_regular.py --net "vit_tiny" --set_seed 0 --save_net "vit_tiny_pairs_3_follow_sin_01_xxx_env_have_const" --plot_path "./images/wd_reg" --imgs 500,5000 --lr 0.005 --lambda_reg 0.01 --opt "AdamW" --epochs 300 --resolution 100 --use_data_aug --nums_pairs 3 --label --warmup_epochs_for_lambda 100

python train_wd_regular.py --net "vit_tiny" --set_seed 0 --save_net "test_const" --plot_path "./images/wd_reg" --imgs 500,5000 --lr 0.005 --lambda_reg 0.01 --opt "AdamW" --epochs 300 --resolution 100 --use_data_aug --nums_pairs 3 --label --warmup_epochs_for_lambda 100

python train_wd_regular_temp.py --net "vit_tiny" --set_seed 0 --save_net "temp_follow" --plot_path "./images/wd_reg" --imgs 500,5000 --lr 0.005 --lambda_reg 0.01 --opt "AdamW" --epochs 300 --resolution 100 --use_data_aug --nums_pairs 3 --label --warmup_epochs_for_lambda 100

python train_wd_regular_temp.py --net "vit_tiny" --set_seed 0 --save_net "temp_follow_full" --plot_path "./images/wd_reg" --imgs 500,5000 --lr 0.005 --lambda_reg 0.01 --opt "AdamW" --epochs 300 --resolution 100 --use_data_aug --nums_pairs 3 --label --warmup_epochs_for_lambda 100

python train_wd_regular.py --net "vit_tiny" --set_seed 0 --save_net "error" --plot_path "./images/wd_reg" --imgs 500,5000 --lr 0.005 --lambda_reg 0.01 --opt "AdamW" --epochs 300 --resolution 100 --use_data_aug --nums_pairs 3 --label --warmup_epochs_for_lambda 100

python train_wd_regular.py --net "vit_tiny" --set_seed 1 --save_net "follow_seed_1" --plot_path "./images/wd_reg" --imgs 500,5000 --lr 0.005 --lambda_reg 0.01 --opt "AdamW" --epochs 300 --resolution 100 --use_data_aug --nums_pairs 3 --label --warmup_epochs_for_lambda 100

python train_wd_regular.py --net "vit_tiny" --set_seed 1 --save_net "follow_seed_1" --plot_path "./images/wd_reg" --imgs 500,5000 --lr 0.005 --lambda_reg 0.01 --opt "AdamW" --epochs 300 --resolution 100 --use_data_aug --nums_pairs 3 --label --warmup_epochs_for_lambda 100

python train_wd_regular.py --net "vit_tiny" --set_seed 2 --save_net "follow_seed_2" --plot_path "./images/wd_reg" --imgs 500,5000 --lr 0.005 --lambda_reg 0.01 --opt "AdamW" --epochs 300 --resolution 100 --use_data_aug --nums_pairs 3 --label --warmup_epochs_for_lambda 100

python train_wd_regular.py --net "vit_tiny" --set_seed 3 --save_net "follow_seed_3" --plot_path "./images/wd_reg" --imgs 500,5000 --lr 0.005 --lambda_reg 0.01 --opt "AdamW" --epochs 300 --resolution 100 --use_data_aug --nums_pairs 3 --label --warmup_epochs_for_lambda 100

python train_wd_regular.py --net "vit_tiny" --set_seed 1 --save_net "follow_seed_1_1p_0" --plot_path "./images/wd_reg" --imgs 500,5000 --lr 0.005 --lambda_reg 0.01 --opt "AdamW" --epochs 300 --resolution 100 --use_data_aug --nums_pairs 3 --label --warmup_epochs_for_lambda 100

python train_wd_regular.py --net "vit_tiny" --set_seed 2 --save_net "follow_seed_2_1p_0" --plot_path "./images/wd_reg" --imgs 500,5000 --lr 0.005 --lambda_reg 0.01 --opt "AdamW" --epochs 300 --resolution 100 --use_data_aug --nums_pairs 3 --label --warmup_epochs_for_lambda 100

python train_wd_regular.py --net "vit_tiny" --set_seed 3 --save_net "follow_seed_3_1p_0" --plot_path "./images/wd_reg" --imgs 500,5000 --lr 0.005 --lambda_reg 0.01 --opt "AdamW" --epochs 300 --resolution 100 --use_data_aug --nums_pairs 3 --label --warmup_epochs_for_lambda 100

python train_wd_regular.py --net "vit_tiny" --set_seed 0 --save_net "follow_seed_0_1p_0" --plot_path "./images/wd_reg" --imgs 500,5000 --lr 0.005 --lambda_reg 0.01 --opt "AdamW" --epochs 300 --resolution 100 --use_data_aug --nums_pairs 3 --label --warmup_epochs_for_lambda 100

python train_wd_regular.py --net "vit_tiny" --set_seed 0 --save_net "vit_tiny_uniSetting_3pair_lambda_0.02_seed_0" --plot_path "./images/wd_reg" --imgs 500,5000 --lr 0.005 --lambda_reg 0.02 --opt "AdamW" --epochs 300 --resolution 100 --use_data_aug --nums_pairs 3 --label --warmup_epochs_for_lambda 100

python train_wd_regular.py --net "vit_tiny" --set_seed 1 --save_net "vit_tiny_uniSetting_3pair_lambda_0.02_seed_1" --plot_path "./images/wd_reg" --imgs 500,5000 --lr 0.005 --lambda_reg 0.02 --opt "AdamW" --epochs 300 --resolution 100 --use_data_aug --nums_pairs 3 --label --warmup_epochs_for_lambda 100

python train_wd_regular.py --net "vit_tiny" --set_seed 0 --save_net "vit_tiny_uniSetting_3pair_lambda_0.02_lr_0.0025" --plot_path "./images/wd_reg" --imgs 500,5000 --lr 0.0025 --lambda_reg 0.02 --opt "AdamW" --epochs 300 --resolution 100 --use_data_aug --nums_pairs 3 --label --warmup_epochs_for_lambda 100

python train_wd_regular.py --net "vit_tiny" --set_seed 0 --save_net "vit_tiny_uniSetting_3pair_lambda_0.01_lr_0.004" --plot_path "./images/wd_reg" --imgs 500,5000 --lr 0.004 --lambda_reg 0.01 --opt "AdamW" --epochs 300 --resolution 100 --use_data_aug --nums_pairs 3 --label --warmup_epochs_for_lambda 100

python train_wd_regular.py --net "vit_tiny" --set_seed 0 --save_net "vit_tiny_uniSetting_3pair_lambda_0.01_lr_0.003" --plot_path "./images/wd_reg" --imgs 500,5000 --lr 0.003 --lambda_reg 0.01 --opt "AdamW" --epochs 300 --resolution 100 --use_data_aug --nums_pairs 3 --label --warmup_epochs_for_lambda 100

python train_wd_regular.py --net "vit_tiny" --set_seed 0 --save_net "vit_tiny_uniSetting_3pair_lambda_0.01_lr_0.002" --plot_path "./images/wd_reg" --imgs 500,5000 --lr 0.002 --lambda_reg 0.01 --opt "AdamW" --epochs 300 --resolution 100 --use_data_aug --nums_pairs 3 --label --warmup_epochs_for_lambda 100

python train_wd_regular.py --net "vit_tiny" --set_seed 0 --save_net "vit_tiny_uniSetting_3pair_lambda_0.01_lr_0.006" --plot_path "./images/wd_reg" --imgs 500,5000 --lr 0.006 --lambda_reg 0.01 --opt "AdamW" --epochs 300 --resolution 100 --use_data_aug --nums_pairs 3 --label --warmup_epochs_for_lambda 100

python train_wd_regular.py --net "vit_tiny" --set_seed 0 --save_net "vit_tiny_uniSetting_1pair_lambda_0.01_lr_0.005_resolution_500" --plot_path "./images/wd_reg" --imgs 500,5000 --lr 0.005 --lambda_reg 0.01 --opt "AdamW" --epochs 300 --resolution 500 --use_data_aug --nums_pairs 1 --label --warmup_epochs_for_lambda 100

python train_wd_regular.py --net "vit_tiny" --set_seed 0 --save_net "vit_tiny_uniSetting_3pair_lambda_0.01_lr_0.005_no_label" --plot_path "./images/wd_reg" --imgs 500,5000 --lr 0.005 --lambda_reg 0.01 --opt "AdamW" --epochs 300 --resolution 100 --use_data_aug --nums_pairs 3 --warmup_epochs_for_lambda 100

python train_wd_regular.py --net "vit_tiny" --set_seed 0 --save_net "vit_tiny_uniSetting_10pair_lambda_0.01_lr_0.005_resolution_30_max_degree_15" --plot_path "./images/wd_reg" --imgs 500,5000 --lr 0.005 --lambda_reg 0.01 --opt "AdamW" --epochs 300 --resolution 30 --max_degree 15 --use_data_aug --nums_pairs 10 --label --warmup_epochs_for_lambda 100

python ./poly/weighted_degree.py --net "vit_tiny" --set_seed 0 --load_net './saved_models/wd_reg/0/temp_follow_full/temp_follow_full.pth' --epochs 200  --resolution 300 --imgs 500,5000

python ./poly/wd_plot.py --net "vit_tiny" --set_seed 0 --load_net './saved_models/wd_reg/0/vit_tiny_uniSetting_1pair_lambda_0.01_lr_0.005_resolution_500/vit_tiny_uniSetting_1pair_lambda_0.01_lr_0.005_resolution_500.pth' --epochs 50  --resolution 300 --imgs 500,5000
# smooth
python train_wd_regular.py --net "vit_tiny" --set_seed 0 --save_net "vit_tiny_uniSetting_1pair_lambda_0.01_lr_0.005_resolution_500_smooth" --plot_path "./images/wd_reg" --imgs 500,5000 --lr 0.005 --lambda_reg 0.01 --opt "AdamW" --epochs 300 --resolution 500 --use_data_aug --nums_pairs 1 --label --warmup_epochs_for_lambda 100 --smooth

python train_wd_regular.py --net "vit_tiny" --set_seed 0 --save_net "vit_tiny_uniSetting_10pair_lambda_0.01_lr_0.005_resolution_50_max_degree_15" --plot_path "./images/wd_reg" --imgs 500,5000 --lr 0.005 --lambda_reg 0.01 --opt "AdamW" --epochs 300 --resolution 50 --max_degree 15 --use_data_aug --nums_pairs 10 --label --warmup_epochs_for_lambda 100

python ./poly/wd_plot.py --net "vit_tiny" --set_seed 0 --load_net './saved_models/wd_reg/0/vit_tiny_uniSetting_1pair_lambda_0.01_lr_0.005_resolution_500/vit_tiny_uniSetting_1pair_lambda_0.01_lr_0.005_resolution_500.pth' --epochs 50  --resolution 300 --imgs 500,5000 --smooth

# 2d
python train_wd_regular_2d.py --net "vit_tiny" --set_seed 0 --save_net "vit_tiny_2d_1pair_lambda_0.01_lr_0.005_resolution_10_max_degree_7" --plot_path "./images/wd_reg" --imgs 500,5000 --lr 0.005 --lambda_reg 0.01 --opt "AdamW" --epochs 300 --resolution 10 --max_degree 7 --use_data_aug --nums_pairs 1 --label --warmup_epochs_for_lambda 100

python train_wd_regular_2d.py --net "vit_tiny" --set_seed 0 --save_net "vit_tiny_2d_3pair_lambda_0.01_lr_0.005_resolution_10_max_degree_7" --plot_path "./images/wd_reg" --imgs 500,5000 --lr 0.005 --lambda_reg 0.01 --opt "AdamW" --epochs 300 --resolution 10 --max_degree 7 --use_data_aug --nums_pairs 3 --label --warmup_epochs_for_lambda 100

python train_wd_regular.py --net "vit_tiny" --set_seed 0 --save_net "vit_tiny_test" --plot_path "./images/wd_reg" --imgs 500,5000 --lr 0.005 --lambda_reg 0.01 --opt "AdamW" --epochs 300 --resolution 100 --use_data_aug --nums_pairs 3 --label --warmup_epochs_for_lambda 100

python train_wd_regular.py --net "vit_tiny" --set_seed 0 --save_net "vit_tiny_uniSetting_1pair_lambda_0.01_lr_0.005_resolution_500_debug" --plot_path "./images/wd_reg" --imgs 500,5000 --lr 0.005 --lambda_reg 0.01 --opt "AdamW" --epochs 300 --resolution 500 --use_data_aug --nums_pairs 1 --label --warmup_epochs_for_lambda 100

python train_wd_regular.py --net "vit_tiny" --set_seed 0 --save_net "vit_tiny_uniSetting_1pair_lambda_0.01_lr_0.005_resolution_300_debug_no_label" --plot_path "./images/wd_reg" --imgs 500,5000 --lr 0.005 --lambda_reg 0.01 --opt "AdamW" --epochs 300 --resolution 300 --use_data_aug --nums_pairs 1 --warmup_epochs_for_lambda 100

python train_wd_regular.py --net "vit_tiny" --set_seed 0 --save_net "vit_tiny_uniSetting_1pair_lambda_0.01_lr_0.005_resolution_500_debug_no_label" --plot_path "./images/wd_reg" --imgs 500,5000 --lr 0.005 --lambda_reg 0.01 --opt "AdamW" --epochs 300 --resolution 500 --use_data_aug --nums_pairs 1 --warmup_epochs_for_lambda 100

python train_wd_regular.py --net "vit_tiny" --set_seed 0 --save_net "vit_tiny_uniSetting_no_reg" --plot_path "./images/wd_reg" --imgs 500,5000 --lr 0.005 --lambda_reg -1 --opt "AdamW" --epochs 300 --resolution 100 --use_data_aug --nums_pairs 1 --warmup_epochs_for_lambda 100 --label

# test batch
python train_wd_regular_multi_batch.py --net "vit_tiny" --set_seed 0 --save_net "vit_tiny_multi_batch_1pair_300resolution" 


--plot_path "./images/wd_reg" --imgs 500,5000 --lr 0.005 --lambda_reg 0.01 --opt "AdamW" --epochs 300 --resolution 300 --use_data_aug --nums_pairs 1 --warmup_epochs_for_lambda 100 --label

python train_wd_regular_multi_batch.py --net "vit_tiny" --set_seed 0 --save_net "vit_tiny_multi_batch_1pair_500resolution" --plot_path "./images/wd_reg" --imgs 500,5000 --lr 0.005 --lambda_reg 0.01 --opt "AdamW" --epochs 300 --resolution 500 --use_data_aug --nums_pairs 1 --warmup_epochs_for_lambda 100 --label

# lr 0.001
python train_wd_regular.py --net "vit_tiny" --set_seed 2 --save_net "vit_tiny_uniSetting_no_reg_lr_0.001_seed_2" --plot_path "./images/wd_reg" --imgs 500,5000 --lr 0.001 --lambda_reg -1 --opt "AdamW" --epochs 300 --resolution 100 --use_data_aug --nums_pairs 1 --label --warmup_epochs_for_lambda 100

python train_wd_regular.py --net "vit_tiny" --set_seed 3 --save_net "vit_tiny_uniSetting_no_reg_lr_0.001_seed_3" --plot_path "./images/wd_reg" --imgs 500,5000 --lr 0.001 --lambda_reg -1 --opt "AdamW" --epochs 300 --resolution 100 --use_data_aug --nums_pairs 1 --label --warmup_epochs_for_lambda 100

python train_wd_regular.py --net "vit_tiny" --set_seed 0 --save_net "vit_tiny_uniSetting_no_reg_lr_0.001_seed_0" --plot_path "./images/wd_reg" --imgs 500,5000 --lr 0.001 --lambda_reg -1 --opt "AdamW" --epochs 300 --resolution 100 --use_data_aug --nums_pairs 1 --label --warmup_epochs_for_lambda 100

python train_wd_regular.py --net "vit_tiny" --set_seed 4 --save_net "vit_tiny_uniSetting_no_reg_lr_0.001_seed_4" --plot_path "./images/wd_reg" --imgs 500,5000 --lr 0.001 --lambda_reg -1 --opt "AdamW" --epochs 300 --resolution 100 --use_data_aug --nums_pairs 1 --label --warmup_epochs_for_lambda 100

python train_wd_regular.py --net "vit_tiny" --set_seed 5 --save_net "vit_tiny_uniSetting_no_reg_lr_0.001_seed_5" --plot_path "./images/wd_reg" --imgs 500,5000 --lr 0.001 --lambda_reg -1 --opt "AdamW" --epochs 300 --resolution 100 --use_data_aug --nums_pairs 1 --label --warmup_epochs_for_lambda 100

python train_wd_regular.py --net "vit_tiny" --set_seed 0 --save_net "vit_tiny_uniSetting_lambda_0.01_1pair_300resolution_lr_0.001_seed_0" --plot_path "./images/wd_reg" --imgs 500,5000 --lr 0.001 --lambda_reg 0.01 --opt "AdamW" --epochs 300 --resolution 300 --use_data_aug --nums_pairs 1 --label --warmup_epochs_for_lambda 100

python train_wd_regular.py --net "vit_tiny" --set_seed 1 --save_net "vit_tiny_uniSetting_lambda_0.01_1pair_300resolution_lr_0.001_seed_1" --plot_path "./images/wd_reg" --imgs 500,5000 --lr 0.001 --lambda_reg 0.01 --opt "AdamW" --epochs 300 --resolution 300 --use_data_aug --nums_pairs 1 --label --warmup_epochs_for_lambda 100

python train_wd_regular.py --net "vit_tiny" --set_seed 2 --save_net "vit_tiny_uniSetting_lambda_0.01_1pair_300resolution_lr_0.001_seed_2" --plot_path "./images/wd_reg" --imgs 500,5000 --lr 0.001 --lambda_reg 0.01 --opt "AdamW" --epochs 300 --resolution 300 --use_data_aug --nums_pairs 1 --label --warmup_epochs_for_lambda 100

python train_wd_regular.py --net "vit_tiny" --set_seed 3 --save_net "vit_tiny_uniSetting_lambda_0.01_1pair_300resolution_lr_0.001_seed_3" --plot_path "./images/wd_reg" --imgs 500,5000 --lr 0.001 --lambda_reg 0.01 --opt "AdamW" --epochs 300 --resolution 300 --use_data_aug --nums_pairs 1 --label --warmup_epochs_for_lambda 100

python train_wd_regular.py --net "vit_tiny" --set_seed 4 --save_net "vit_tiny_uniSetting_lambda_0.01_1pair_300resolution_lr_0.001_seed_4" --plot_path "./images/wd_reg" --imgs 500,5000 --lr 0.001 --lambda_reg 0.01 --opt "AdamW" --epochs 300 --resolution 300 --use_data_aug --nums_pairs 1 --label --warmup_epochs_for_lambda 100

python train_wd_regular.py --net "vit_tiny" --set_seed 5 --save_net "vit_tiny_uniSetting_lambda_0.01_1pair_300resolution_lr_0.001_seed_5" --plot_path "./images/wd_reg" --imgs 500,5000 --lr 0.001 --lambda_reg 0.01 --opt "AdamW" --epochs 300 --resolution 300 --use_data_aug --nums_pairs 1 --label --warmup_epochs_for_lambda 100

# torch: random sample
python train_wd_regular_torch.py --net "vit_tiny" --set_seed 0 --save_net "vit_tiny_torch_pair100_resolution3_max_degree_2_lambda_0.01_lr_0.005_random_alpha" --plot_path "./images/wd_reg" --imgs 500,5000 --lr 0.005 --lambda_reg 0.01 --opt "AdamW" --epochs 300 --resolution 3 --max_degree 2 --use_data_aug --nums_pairs 100 --label --warmup_epochs_for_lambda 100 --random_alpha

python train_wd_regular_torch.py --net "vit_tiny" --set_seed 0 --save_net "vit_tiny_torch_pair15_resolution20_max_degree_10_lambda_0.01_lr_0.005_random_alpha" --plot_path "./images/wd_reg" --imgs 500,5000 --lr 0.005 --lambda_reg 0.01 --opt "AdamW" --epochs 300 --resolution 20 --max_degree 10 --use_data_aug --nums_pairs 15 --label --warmup_epochs_for_lambda 100 --random_alpha

python train_wd_regular_torch.py --net "vit_tiny" --set_seed 0 --save_net "vit_tiny_torch_pair10_resolution4_max_degree_2_lambda_0.01_lr_0.005_random_alpha" --plot_path "./images/wd_reg" --imgs 500,5000 --lr 0.005 --lambda_reg 0.01 --opt "AdamW" --epochs 300 --resolution 4 --max_degree 2 --use_data_aug --nums_pairs 10 --label --warmup_epochs_for_lambda 100 --random_alpha

python train_wd_regular_torch.py --net "vit_tiny" --set_seed 0 --save_net "vit_tiny_torch_pair12_resolution4_max_degree_2_lambda_0.01_lr_0.005_random_alpha" --plot_path "./images/wd_reg" --imgs 500,5000 --lr 0.005 --lambda_reg 0.01 --opt "AdamW" --epochs 300 --resolution 4 --max_degree 2 --use_data_aug --nums_pairs 12 --label --warmup_epochs_for_lambda 100 --random_alpha

python train_wd_regular_torch.py --net "vit_tiny" --set_seed 0 --save_net "vit_tiny_torch_pair25_resolution4_max_degree_2_lambda_0.01_lr_0.005_random_alpha" --plot_path "./images/wd_reg" --imgs 500,5000 --lr 0.005 --lambda_reg 0.01 --opt "AdamW" --epochs 300 --resolution 4 --max_degree 2 --use_data_aug --nums_pairs 25 --label --warmup_epochs_for_lambda 100 --random_alpha

python train_wd_regular_torch.py --net "vit_tiny" --set_seed 0 --save_net "vit_tiny_torch_pair50_resolution4_max_degree_2_lambda_0.01_lr_0.005_random_alpha" --plot_path "./images/wd_reg" --imgs 500,5000 --lr 0.005 --lambda_reg 0.01 --opt "AdamW" --epochs 300 --resolution 4 --max_degree 2 --use_data_aug --nums_pairs 50 --label --warmup_epochs_for_lambda 100 --random_alpha

# sample in batch
python train_wd_regular_torch.py --net "vit_tiny" --set_seed 0 --save_net "vit_tiny_torch_pair100_resolution3_max_degree_2_lambda_0.01_lr_0.005_random_alpha_batch" --plot_path "./images/wd_reg" --imgs 500,5000 --lr 0.005 --lambda_reg 0.01 --opt "AdamW" --epochs 300 --resolution 3 --max_degree 2 --use_data_aug --nums_pairs 100 --label --warmup_epochs_for_lambda 100 --random_alpha

python train_wd_regular_torch.py --net "vit_tiny" --set_seed 0 --save_net "vit_tiny_torch_pair15_resolution20_max_degree_10_lambda_0.01_lr_0.005_random_alpha_batch" --plot_path "./images/wd_reg" --imgs 500,5000 --lr 0.005 --lambda_reg 0.01 --opt "AdamW" --epochs 300 --resolution 20 --max_degree 10 --use_data_aug --nums_pairs 15 --label --warmup_epochs_for_lambda 100 --random_alpha

python train_wd_regular_torch.py --net "vit_tiny" --set_seed 0 --save_net "vit_tiny_torch_pair10_resolution4_max_degree_2_lambda_0.01_lr_0.005_random_alpha_batch" --plot_path "./images/wd_reg" --imgs 500,5000 --lr 0.005 --lambda_reg 0.01 --opt "AdamW" --epochs 300 --resolution 4 --max_degree 2 --use_data_aug --nums_pairs 10 --label --warmup_epochs_for_lambda 100 --random_alpha

python train_wd_regular_torch.py --net "vit_tiny" --set_seed 0 --save_net "vit_tiny_torch_pair12_resolution4_max_degree_2_lambda_0.01_lr_0.005_random_alpha_batch" --plot_path "./images/wd_reg" --imgs 500,5000 --lr 0.005 --lambda_reg 0.01 --opt "AdamW" --epochs 300 --resolution 4 --max_degree 2 --use_data_aug --nums_pairs 12 --label --warmup_epochs_for_lambda 100 --random_alpha

python train_wd_regular_torch.py --net "vit_tiny" --set_seed 0 --save_net "vit_tiny_torch_pair25_resolution4_max_degree_2_lambda_0.01_lr_0.005_random_alpha_batch" --plot_path "./images/wd_reg" --imgs 500,5000 --lr 0.005 --lambda_reg 0.01 --opt "AdamW" --epochs 300 --resolution 4 --max_degree 2 --use_data_aug --nums_pairs 25 --label --warmup_epochs_for_lambda 100 --random_alpha

python train_wd_regular_torch.py --net "vit_tiny" --set_seed 0 --save_net "vit_tiny_torch_pair50_resolution4_max_degree_2_lambda_0.01_lr_0.005_random_alpha_batch" --plot_path "./images/wd_reg" --imgs 500,5000 --lr 0.005 --lambda_reg 0.01 --opt "AdamW" --epochs 300 --resolution 4 --max_degree 2 --use_data_aug --nums_pairs 50 --label --warmup_epochs_for_lambda 100 --random_alpha

# pca
python train_wd_regular_torch.py --net "vit_tiny" --set_seed 0 --save_net "vit_tiny_torch_pair2_resolution100_max_degree_40_lambda_0.01_lr_0.005_pca" --plot_path "./images/wd_reg" --imgs 500,5000 --lr 0.005 --lambda_reg 0.01 --opt "AdamW" --epochs 300 --resolution 100 --max_degree 40 --use_data_aug --nums_pairs 2 --label --warmup_epochs_for_lambda 100 --pca_reg
python train_wd_regular_torch.py --net "vit_tiny" --set_seed 0 --save_net "vit_tiny_torch_debug_pca" --plot_path "./images/wd_reg" --imgs 500,5000 --lr 0.005 --lambda_reg 0.01 --opt "AdamW" --epochs 300 --resolution 100 --max_degree 40 --use_data_aug --nums_pairs 2 --label --warmup_epochs_for_lambda 100 --pca_reg
python train_wd_regular_torch.py --net "vit_tiny" --set_seed 0 --save_net "vit_tiny_torch_pair4_resolution75_max_degree_40_lambda_0.01_lr_0.005_pca" --plot_path "./images/wd_reg" --imgs 500,5000 --lr 0.005 --lambda_reg 0.01 --opt "AdamW" --epochs 300 --resolution 75 --max_degree 40 --use_data_aug --nums_pairs 4 --label --warmup_epochs_for_lambda 100 --pca_reg

python train_wd_regular_torch.py --net "vit_tiny" --set_seed 0 --save_net "vit_tiny_torch_pair10_resolution30_max_degree_15_lambda_0.01_lr_0.005_pca" --plot_path "./images/wd_reg" --imgs 500,5000 --lr 0.005 --lambda_reg 0.01 --opt "AdamW" --epochs 300 --resolution 30 --max_degree 15 --use_data_aug --nums_pairs 10 --label --warmup_epochs_for_lambda 100 --pca_reg

python train_wd_regular_torch.py --net "vit_tiny" --set_seed 0 --save_net "vit_tiny_torch_pair15_resolution20_max_degree_10_lambda_0.01_lr_0.005_pca" --plot_path "./images/wd_reg" --imgs 500,5000 --lr 0.005 --lambda_reg 0.01 --opt "AdamW" --epochs 300 --resolution 20 --max_degree 10 --use_data_aug --nums_pairs 15 --label --warmup_epochs_for_lambda 100 --pca_reg

python train_wd_regular_torch.py --net "vit_tiny" --set_seed 0 --save_net "vit_tiny_torch_pair100_resolution3_max_degree_2_lambda_0.01_lr_0.005_pca" --plot_path "./images/wd_reg" --imgs 500,5000 --lr 0.005 --lambda_reg 0.01 --opt "AdamW" --epochs 300 --resolution 3 --max_degree 2 --use_data_aug --nums_pairs 100 --label --warmup_epochs_for_lambda 100 --pca_reg

python train_wd_regular_torch.py --net "vit_tiny" --set_seed 0 --save_net "vit_tiny_torch_pair100_resolution4_max_degree_2_lambda_0.01_lr_0.005_pca" --plot_path "./images/wd_reg" --imgs 500,5000 --lr 0.005 --lambda_reg 0.01 --opt "AdamW" --epochs 300 --resolution 4 --max_degree 2 --use_data_aug --nums_pairs 100 --label --warmup_epochs_for_lambda 100 --pca_reg


# many pair
python train_wd_regular_torch.py --net "vit_tiny" --set_seed 0 --save_net "vit_tiny_torch_pair200_resolution4_max_degree_2_lambda_0.01_lr_0.005" --plot_path "./images/wd_reg" --imgs 500,5000 --lr 0.005 --lambda_reg 0.01 --opt "AdamW" --epochs 300 --resolution 4 --max_degree 2 --use_data_aug --nums_pairs 200 --label --warmup_epochs_for_lambda 100

python train_wd_regular_torch.py --net "vit_tiny" --set_seed 0 --save_net "vit_tiny_torch_pair400_resolution4_max_degree_2_lambda_0.01_lr_0.005" --plot_path "./images/wd_reg" --imgs 500,5000 --lr 0.005 --lambda_reg 0.01 --opt "AdamW" --epochs 300 --resolution 4 --max_degree 2 --use_data_aug --nums_pairs 400 --label --warmup_epochs_for_lambda 100

python train_wd_regular_torch.py --net "vit_tiny" --set_seed 0 --save_net "vit_tiny_torch_pair400_resolution3_max_degree_2_lambda_0.01_lr_0.005" --plot_path "./images/wd_reg" --imgs 500,5000 --lr 0.005 --lambda_reg 0.01 --opt "AdamW" --epochs 300 --resolution 3 --max_degree 2 --use_data_aug --nums_pairs 400 --label --warmup_epochs_for_lambda 100

python train_wd_regular_torch.py --net "vit_tiny" --set_seed 0 --save_net "vit_tiny_torch_pair200_resolution3_max_degree_2_lambda_0.01_lr_0.005" --plot_path "./images/wd_reg" --imgs 500,5000 --lr 0.005 --lambda_reg 0.01 --opt "AdamW" --epochs 300 --resolution 3 --max_degree 2 --use_data_aug --nums_pairs 200 --label --warmup_epochs_for_lambda 100

python train_wd_regular_torch.py --net "vit_tiny" --set_seed 0 --save_net "vit_tiny_torch_pair800_resolution3_max_degree_2_lambda_0.01_lr_0.005" --plot_path "./images/wd_reg" --imgs 500,5000 --lr 0.005 --lambda_reg 0.01 --opt "AdamW" --epochs 300 --resolution 3 --max_degree 2 --use_data_aug --nums_pairs 800 --label --warmup_epochs_for_lambda 100

python train_wd_regular_torch.py --net "vit_tiny" --set_seed 2 --save_net "vit_tiny_torch_pair200_resolution3_max_degree_2_lambda_0.01_lr_0.005_seed_2" --plot_path "./images/wd_reg" --imgs 500,5000 --lr 0.005 --lambda_reg 0.01 --opt "AdamW" --epochs 300 --resolution 3 --max_degree 2 --use_data_aug --nums_pairs 200 --label --warmup_epochs_for_lambda 100

python train_wd_regular_torch.py --net "vit_tiny" --set_seed 0 --save_net "vit_tiny_torch_pair800_resolution4_max_degree_2_lambda_0.01_lr_0.005" --plot_path "./images/wd_reg" --imgs 500,5000 --lr 0.005 --lambda_reg 0.01 --opt "AdamW" --epochs 300 --resolution 4 --max_degree 2 --use_data_aug --nums_pairs 800 --label --warmup_epochs_for_lambda 100

# square
python train_wd_regular_torch.py --net "vit_tiny" --set_seed 0 --save_net "vit_tiny_torch_pair3_resolution100_max_degree_40_lambda_0.01_lr_0.005_square" --plot_path "./images/wd_reg" --imgs 500,5000 --lr 0.005 --lambda_reg 0.01 --opt "AdamW" --epochs 300 --resolution 100 --max_degree 40 --use_data_aug --nums_pairs 3 --label --warmup_epochs_for_lambda 100 --square

python train_wd_regular_torch.py --net "vit_tiny" --set_seed 0 --save_net "vit_tiny_torch_pair4_resolution75_max_degree_40_lambda_0.01_lr_0.005_square" --plot_path "./images/wd_reg" --imgs 500,5000 --lr 0.005 --lambda_reg 0.01 --opt "AdamW" --epochs 300 --resolution 75 --max_degree 40 --use_data_aug --nums_pairs 4 --label --warmup_epochs_for_lambda 100 --square

python train_wd_regular_torch.py --net "vit_tiny" --set_seed 0 --save_net "vit_tiny_torch_pair1_resolution300_max_degree_40_lambda_0.01_lr_0.005_square" --plot_path "./images/wd_reg" --imgs 500,5000 --lr 0.005 --lambda_reg 0.01 --opt "AdamW" --epochs 300 --resolution 300 --max_degree 40 --use_data_aug --nums_pairs 1 --label --warmup_epochs_for_lambda 100 --square

python train_wd_regular_torch.py --net "vit_tiny" --set_seed 0 --save_net "vit_tiny_torch_pair3_resolution100_max_degree_40_lambda_0.05_lr_0.005_square" --plot_path "./images/wd_reg" --imgs 500,5000 --lr 0.005 --lambda_reg 0.05 --opt "AdamW" --epochs 300 --resolution 100 --max_degree 40 --use_data_aug --nums_pairs 3 --label --warmup_epochs_for_lambda 100 --square

python train_wd_regular_torch.py --net "vit_tiny" --set_seed 0 --save_net "vit_tiny_torch_pair3_resolution100_max_degree_40_lambda_0.04_lr_0.005_square" --plot_path "./images/wd_reg" --imgs 500,5000 --lr 0.005 --lambda_reg 0.04 --opt "AdamW" --epochs 300 --resolution 100 --max_degree 40 --use_data_aug --nums_pairs 3 --label --warmup_epochs_for_lambda 100 --square

python train_wd_regular_torch.py --net "vit_tiny" --set_seed 0 --save_net "vit_tiny_torch_pair3_resolution100_max_degree_40_lambda_0.03_lr_0.005_square" --plot_path "./images/wd_reg" --imgs 500,5000 --lr 0.005 --lambda_reg 0.03 --opt "AdamW" --epochs 300 --resolution 100 --max_degree 40 --use_data_aug --nums_pairs 3 --label --warmup_epochs_for_lambda 100 --square

python train_wd_regular_torch.py --net "vit_tiny" --set_seed 0 --save_net "vit_tiny_torch_pair3_resolution100_max_degree_40_lambda_0.02_lr_0.005_square" --plot_path "./images/wd_reg" --imgs 500,5000 --lr 0.005 --lambda_reg 0.02 --opt "AdamW" --epochs 300 --resolution 100 --max_degree 40 --use_data_aug --nums_pairs 3 --label --warmup_epochs_for_lambda 100 --square

# label smoothing
python train_wd_regular_torch.py --net "vit_tiny" --set_seed 0 --save_net "vit_tiny_torch_pair3_resolution100_max_degree_40_lambda_0.01_lr_0.005_label_smoothing_0.1" --plot_path "./images/wd_reg" --imgs 500,5000 --lr 0.005 --lambda_reg 0.01 --opt "AdamW" --epochs 300 --resolution 100 --max_degree 40 --use_data_aug --nums_pairs 3 --label --warmup_epochs_for_lambda 100 --label_smoothing 0.1

python train_wd_regular_torch.py --net "vit_tiny" --set_seed 0 --save_net "vit_tiny_torch_pair3_resolution100_max_degree_40_lambda_0.01_lr_0.005_label_smoothing_0.05" --plot_path "./images/wd_reg" --imgs 500,5000 --lr 0.005 --lambda_reg 0.01 --opt "AdamW" --epochs 300 --resolution 100 --max_degree 40 --use_data_aug --nums_pairs 3 --label --warmup_epochs_for_lambda 100 --label_smoothing 0.05

python train_wd_regular_torch.py --net "vit_tiny" --set_seed 0 --save_net "vit_tiny_torch_pair1_resolution300_max_degree_40_lambda_0.01_lr_0.005_label_smoothing_0.1" --plot_path "./images/wd_reg" --imgs 500,5000 --lr 0.005 --lambda_reg 0.01 --opt "AdamW" --epochs 300 --resolution 300 --max_degree 40 --use_data_aug --nums_pairs 1 --label --warmup_epochs_for_lambda 100 --label_smoothing 0.1

python train_wd_regular_torch.py --net "vit_tiny" --set_seed 0 --save_net "vit_tiny_torch_pair1_resolution300_max_degree_40_lambda_0.01_lr_0.005_label_smoothing_0.05" --plot_path "./images/wd_reg" --imgs 500,5000 --lr 0.005 --lambda_reg 0.01 --opt "AdamW" --epochs 300 --resolution 300 --max_degree 40 --use_data_aug --nums_pairs 1 --label --warmup_epochs_for_lambda 100 --label_smoothing 0.05

python train_wd_regular_torch.py --net "vit_tiny" --set_seed 0 --save_net "vit_tiny_torch_no_reg_lr_0.005_label_smoothing_0.1" --plot_path "./images/wd_reg" --imgs 500,5000 --lr 0.005 --lambda_reg -1 --opt "AdamW" --epochs 300 --resolution 100 --max_degree 40 --use_data_aug --nums_pairs 3 --label --warmup_epochs_for_lambda 100 --label_smoothing 0.1

python train_wd_regular_torch.py --net "vit_tiny" --set_seed 0 --save_net "vit_tiny_torch_no_reg_lr_0.005_label_smoothing_0.05" --plot_path "./images/wd_reg" --imgs 500,5000 --lr 0.005 --lambda_reg -1 --opt "AdamW" --epochs 300 --resolution 100 --max_degree 40 --use_data_aug --nums_pairs 3 --label --warmup_epochs_for_lambda 100 --label_smoothing 0.05

python train_wd_regular_torch.py --net "vit_tiny" --set_seed 0 --save_net "vit_tiny_torch_debug" --plot_path "./images/wd_reg" --imgs 500,5000 --lr 0.005 --lambda_reg 0.01 --opt "AdamW" --epochs 300 --resolution 100 --max_degree 40 --use_data_aug --nums_pairs 3 --label --warmup_epochs_for_lambda 100

# 0 0 1 1 1 1 1 1 1 
python train_wd_regular_torch.py --net "vit_tiny" --set_seed 0 --save_net "vit_tiny_torch_pair3_resolution100_max_degree_40_lambda_0.01_lr_0.005_square_00111" --plot_path "./images/wd_reg" --imgs 500,5000 --lr 0.005 --lambda_reg 0.01 --opt "AdamW" --epochs 300 --resolution 100 --max_degree 40 --use_data_aug --nums_pairs 3 --label --warmup_epochs_for_lambda 100 --square --degree_mode "00111"


python train_wd_regular_torch.py --net "vit_tiny" --set_seed 0 --save_net "vit_tiny_torch_pair3_resolution100_max_degree_40_lambda_0.03_lr_0.005_square_00111" --plot_path "./images/wd_reg" --imgs 500,5000 --lr 0.005 --lambda_reg 0.03 --opt "AdamW" --epochs 300 --resolution 100 --max_degree 40 --use_data_aug --nums_pairs 3 --label --warmup_epochs_for_lambda 100 --square --degree_mode "00111"

python train_wd_regular_torch.py --net "vit_tiny" --set_seed 0 --save_net "vit_tiny_torch_pair3_resolution100_max_degree_40_lambda_0.01_lr_0.005_00111" --plot_path "./images/wd_reg" --imgs 500,5000 --lr 0.005 --lambda_reg 0.01 --opt "AdamW" --epochs 300 --resolution 100 --max_degree 40 --use_data_aug --nums_pairs 3 --label --warmup_epochs_for_lambda 100 --degree_mode "00111"


# re pca
python train_wd_regular_torch.py --net "vit_tiny" --set_seed 0 --save_net "vit_tiny_torch_pair3_resolution100_max_degree_40_lambda_0.01_lr_0.005_pca_seed_0" --plot_path "./images/wd_reg" --imgs 500,5000 --lr 0.005 --lambda_reg 0.01 --opt "AdamW" --epochs 300 --resolution 100 --max_degree 40 --use_data_aug --nums_pairs 3 --label --warmup_epochs_for_lambda 100 --pca_reg

python train_wd_regular_torch.py --net "vit_tiny" --set_seed 1 --save_net "vit_tiny_torch_pair3_resolution100_max_degree_40_lambda_0.01_lr_0.005_pca_seed_1" --plot_path "./images/wd_reg" --imgs 500,5000 --lr 0.005 --lambda_reg 0.01 --opt "AdamW" --epochs 300 --resolution 100 --max_degree 40 --use_data_aug --nums_pairs 3 --label --warmup_epochs_for_lambda 100 --pca_reg

python train_wd_regular_torch.py --net "vit_tiny" --set_seed 2 --save_net "vit_tiny_torch_pair3_resolution100_max_degree_40_lambda_0.01_lr_0.005_pca_seed_2" --plot_path "./images/wd_reg" --imgs 500,5000 --lr 0.005 --lambda_reg 0.01 --opt "AdamW" --epochs 300 --resolution 100 --max_degree 40 --use_data_aug --nums_pairs 3 --label --warmup_epochs_for_lambda 100 --pca_reg

python train_wd_regular_torch.py --net "vit_tiny" --set_seed 0 --save_net "vit_tiny_torch_pair3_resolution100_max_degree_40_lambda_0.01_lr_0.005_pca_float64" --plot_path "./images/wd_reg" --imgs 500,5000 --lr 0.005 --lambda_reg 0.01 --opt "AdamW" --epochs 300 --resolution 100 --max_degree 40 --use_data_aug --nums_pairs 3 --label --warmup_epochs_for_lambda 100 --pca_reg

python train_wd_regular_torch.py --net "vit_tiny" --set_seed 0 --save_net "vit_tiny_torch_pair3_resolution100_max_degree_40_lambda_0.01_lr_0.005_float64" --plot_path "./images/wd_reg" --imgs 500,5000 --lr 0.005 --lambda_reg 0.01 --opt "AdamW" --epochs 300 --resolution 100 --max_degree 40 --use_data_aug --nums_pairs 3 --label --warmup_epochs_for_lambda 100



python train_wd_regular_torch.py --net "vit_tiny" --set_seed 0 --save_net "vit_tiny_torch_pair3_resolution100_max_degree_40_lambda_0.02_lr_0.005_pca_float64_square" --plot_path "./images/wd_reg" --imgs 500,5000 --lr 0.005 --lambda_reg 0.02 --opt "AdamW" --epochs 300 --resolution 100 --max_degree 40 --use_data_aug --nums_pairs 3 --label --warmup_epochs_for_lambda 100 --pca_reg --square

python train_wd_regular_torch.py --net "vit_tiny" --set_seed 1 --save_net "vit_tiny_torch_pair3_resolution100_max_degree_40_lambda_0.02_lr_0.005_pca_float64_square_seed_1" --plot_path "./images/wd_reg" --imgs 500,5000 --lr 0.005 --lambda_reg 0.02 --opt "AdamW" --epochs 300 --resolution 100 --max_degree 40 --use_data_aug --nums_pairs 3 --label --warmup_epochs_for_lambda 100 --pca_reg --square

python train_wd_regular_torch.py --net "vit_tiny" --set_seed 2 --save_net "vit_tiny_torch_pair3_resolution100_max_degree_40_lambda_0.02_lr_0.005_pca_float64_square_seed_2" --plot_path "./images/wd_reg" --imgs 500,5000 --lr 0.005 --lambda_reg 0.02 --opt "AdamW" --epochs 300 --resolution 100 --max_degree 40 --use_data_aug --nums_pairs 3 --label --warmup_epochs_for_lambda 100 --pca_reg --square

python train_wd_regular_torch.py --net "vit_tiny" --set_seed 1 --save_net "vit_tiny_torch_pair3_resolution100_max_degree_40_lambda_0.01_lr_0.005_pca_float64_seed_1" --plot_path "./images/wd_reg" --imgs 500,5000 --lr 0.005 --lambda_reg 0.01 --opt "AdamW" --epochs 300 --resolution 100 --max_degree 40 --use_data_aug --nums_pairs 3 --label --warmup_epochs_for_lambda 100 --pca_reg

python train_wd_regular_torch.py --net "vit_tiny" --set_seed 2 --save_net "vit_tiny_torch_pair3_resolution100_max_degree_40_lambda_0.01_lr_0.005_pca_float64_seed_2" --plot_path "./images/wd_reg" --imgs 500,5000 --lr 0.005 --lambda_reg 0.01 --opt "AdamW" --epochs 300 --resolution 100 --max_degree 40 --use_data_aug --nums_pairs 3 --label --warmup_epochs_for_lambda 100 --pca_reg

python train_wd_regular_torch.py --net "vit_tiny" --set_seed 0 --save_net "vit_tiny_torch_pair3_resolution100_max_degree_40_lambda_0.02_lr_0.005_float64_square" --plot_path "./images/wd_reg" --imgs 500,5000 --lr 0.005 --lambda_reg 0.02 --opt "AdamW" --epochs 300 --resolution 100 --max_degree 40 --use_data_aug --nums_pairs 3 --label --warmup_epochs_for_lambda 100 --square


# mixup
python train_wd_regular_mixup_as_reg.py --net "vit_tiny" --set_seed 0 --save_net "vit_tiny_mixup_alpha_1_as_reg_mse_lr_0.005_resolution_2" --plot_path "./images/wd_reg" --imgs 500,5000 --lr 0.005 --lambda_reg 1 --opt "AdamW" --epochs 300 --use_data_aug --mixup_alpha 1.0 --resolution 2

python train_wd_regular_mixup_as_reg.py --net "vit_tiny" --set_seed 0 --save_net "vit_tiny_mixup_alpha_1_as_reg_ce_lr_0.005_resolution_2" --plot_path "./images/wd_reg" --imgs 500,5000 --lr 0.005 --lambda_reg 1 --opt "AdamW" --epochs 300 --use_data_aug --mixup_alpha 1.0 --resolution 2

python train_wd_regular_torch.py --net "vit_tiny" --set_seed 0 --save_net "vit_tiny_torch_pair200_resolution5_max_degree_2_lambda_0.01_lr_0.005_label_random" --plot_path "./images/wd_reg" --imgs 500,5000 --lr 0.005 --lambda_reg 0.01 --opt "AdamW" --epochs 300 --resolution 5 --max_degree 2 --use_data_aug --nums_pairs 200 --label_random --warmup_epochs_for_lambda 100

python train_wd_regular_torch.py --net "vit_tiny" --set_seed 0 --save_net "vit_tiny_torch_pair100_resolution5_max_degree_2_lambda_0.01_lr_0.005_label_random" --plot_path "./images/wd_reg" --imgs 500,5000 --lr 0.005 --lambda_reg 0.01 --opt "AdamW" --epochs 300 --resolution 5 --max_degree 2 --use_data_aug --nums_pairs 100 --label_random --warmup_epochs_for_lambda 100



python train_wd_regular_torch.py --net "vit_tiny" --set_seed 0 --save_net "vit_tiny_torch_pair80_resolution30_max_degree_20_lambda_1.6_lr_0.005_ce" --plot_path "./images/wd_reg" --imgs 500,5000 --lr 0.005 --lambda_reg 1.6 --opt "AdamW" --epochs 300 --resolution 30 --max_degree 20 --use_data_aug --nums_pairs 80 --label --warmup_epochs_for_lambda 100 --ce_reg

python train_wd_regular_torch.py --net "vit_tiny" --set_seed 0 --save_net "vit_tiny_torch_pair256_resolution4_max_degree_2_lambda_1.0_lr_0.005_ce" --plot_path "./images/wd_reg" --imgs 500,5000 --lr 0.005 --lambda_reg 1.0 --opt "AdamW" --epochs 300 --resolution 4 --max_degree 2 --use_data_aug --nums_pairs 256 --label --warmup_epochs_for_lambda 100 --ce_reg

python train_wd_regular_torch.py --net "vit_tiny" --set_seed 0 --save_net "vit_tiny_torch_pair3_resolution100_max_degree_40_lambda_0.01_lr_0.005_ce" --plot_path "./images/wd_reg" --imgs 500,5000 --lr 0.005 --lambda_reg 0.01 --opt "AdamW" --epochs 300 --resolution 100 --max_degree 40 --use_data_aug --nums_pairs 3 --label --warmup_epochs_for_lambda 100 --ce_reg

python train_wd_regular_torch.py --net "vit_tiny" --set_seed 0 --save_net "vit_tiny_torch_ce_debug" --plot_path "./images/wd_reg" --imgs 500,5000 --lr 0.005 --lambda_reg 0.1 --opt "AdamW" --epochs 300 --resolution 100 --max_degree 40 --use_data_aug --nums_pairs 1 --label --warmup_epochs_for_lambda 100 --ce_reg

python train_wd_regular_torch.py --net "vit_tiny" --set_seed 0 --save_net "vit_tiny_torch_pair1_resolution100_max_degree_40_lambda_1_lr_0.005_ce" --plot_path "./images/wd_reg" --imgs 500,5000 --lr 0.005 --lambda_reg 1.0 --opt "AdamW" --epochs 300 --resolution 100 --max_degree 40 --use_data_aug --nums_pairs 1 --label --warmup_epochs_for_lambda 100 --ce_reg

python train_wd_regular_torch.py --net "vit_tiny" --set_seed 0 --save_net "vit_tiny_torch_ce_debug" --plot_path "./images/wd_reg" --imgs 500,5000 --lr 0.005 --lambda_reg 100 --opt "AdamW" --epochs 300 --resolution 100 --max_degree 40 --use_data_aug --nums_pairs 1 --label  --ce_reg

# parallel
python train_wd_regular_torch_parallel.py --net "vit_tiny" --set_seed 0 --save_net "vit_tiny_torch_pair3_resolution100_max_degree_40_lambda_0.01_lr_0.005_parallel" --plot_path "./images/wd_reg" --imgs 500,5000 --lr 0.005 --lambda_reg 0.01 --opt "AdamW" --epochs 300 --resolution 100 --max_degree 40 --use_data_aug --nums_pairs 3 --label --warmup_epochs_for_lambda 100

python train_wd_regular_torch.py --net "vit_tiny" --set_seed 0 --save_net "vit_tiny_torch_pair3_resolution100_max_degree_40_lambda_0.01_lr_0.005" --plot_path "./images/wd_reg" --imgs 500,5000 --lr 0.005 --lambda_reg 0.01 --opt "AdamW" --epochs 300 --resolution 100 --max_degree 40 --use_data_aug --nums_pairs 3 --label --warmup_epochs_for_lambda 100

python train_wd_regular_torch.py --net "vit_tiny" --set_seed 0 --save_net "vit_tiny_torch_pair256_resolution4_max_degree_2_lambda_1.0_lr_0.005" --plot_path "./images/wd_reg" --imgs 500,5000 --lr 0.005 --lambda_reg 1.0 --opt "AdamW" --epochs 300 --resolution 4 --max_degree 2 --use_data_aug --nums_pairs 256 --label --warmup_epochs_for_lambda 100

python train_wd_regular_torch.py --net "vit_tiny" --set_seed 0 --save_net "vit_tiny_torch_pair80_resolution30_max_degree_20_lambda_1.6_lr_0.005" --plot_path "./images/wd_reg" --imgs 500,5000 --lr 0.005 --lambda_reg 1.6 --opt "AdamW" --epochs 300 --resolution 30 --max_degree 20 --use_data_aug --nums_pairs 80 --label --warmup_epochs_for_lambda 100


# +1 -1
python train_wd_regular_torch.py --net "vit_tiny" --set_seed 0 --save_net "vit_tiny_torch_random_alpha_debug" --plot_path "./images/wd_reg" --imgs 500,5000 --lr 0.005 --lambda_reg 0.01 --opt "AdamW" --epochs 300 --resolution 4 --max_degree 2 --use_data_aug --nums_pairs 2 --label --warmup_epochs_for_lambda 100 --random_alpha


python train_wd_regular_torch.py --net "vit_tiny" --set_seed 0 --save_net "vit_tiny_torch_pair256_resolution30_max_degree_15_lambda_2.0_lr_0.005" --plot_path "./images/wd_reg" --imgs 500,5000 --lr 0.005 --lambda_reg 2.0 --opt "AdamW" --epochs 300 --resolution 30 --max_degree 15 --use_data_aug --nums_pairs 256 --label --warmup_epochs_for_lambda 100


python train_wd_regular_torch.py --net "vit_tiny" --set_seed 0 --save_net "vit_tiny_torch_pair256_resolution30_max_degree_15_lambda_2.0_lr_0.005_random_sum" --plot_path "./images/wd_reg" --imgs 500,5000 --lr 0.005 --lambda_reg 2.0 --opt "AdamW" --epochs 300 --resolution 30 --max_degree 15 --use_data_aug --nums_pairs 256 --label --warmup_epochs_for_lambda 100 --random_sum

python train_wd_regular_torch.py --net "vit_tiny" --set_seed 0 --save_net "vit_tiny_torch_pair256_resolution25_max_degree_12_lambda_2.0_lr_0.005_random_sum" --plot_path "./images/wd_reg" --imgs 500,5000 --lr 0.005 --lambda_reg 2.0 --opt "AdamW" --epochs 300 --resolution 25 --max_degree 12 --use_data_aug --nums_pairs 256 --label --warmup_epochs_for_lambda 100 --random_sum

python train_wd_regular_torch.py --net "vit_tiny" --set_seed 0 --save_net "vit_tiny_torch_pair256_resolution20_max_degree_10_lambda_2.0_lr_0.005_random_sum" --plot_path "./images/wd_reg" --imgs 500,5000 --lr 0.005 --lambda_reg 2.0 --opt "AdamW" --epochs 300 --resolution 20 --max_degree 10 --use_data_aug --nums_pairs 256 --label --warmup_epochs_for_lambda 100 --random_sum

python train_wd_regular_torch.py --net "vit_tiny" --set_seed 0 --save_net "vit_tiny_torch_pair256_resolution15_max_degree_7_lambda_2.0_lr_0.005_random_sum" --plot_path "./images/wd_reg" --imgs 500,5000 --lr 0.005 --lambda_reg 2.0 --opt "AdamW" --epochs 300 --resolution 15 --max_degree 7 --use_data_aug --nums_pairs 256 --label --warmup_epochs_for_lambda 100 --random_sum

python train_wd_regular_torch.py --net "vit_tiny" --set_seed 0 --save_net "vit_tiny_torch_pair256_resolution10_max_degree_5_lambda_2.0_lr_0.005_random_sum" --plot_path "./images/wd_reg" --imgs 500,5000 --lr 0.005 --lambda_reg 2.0 --opt "AdamW" --epochs 300 --resolution 10 --max_degree 5 --use_data_aug --nums_pairs 256 --label --warmup_epochs_for_lambda 100 --random_sum

python train_wd_regular_torch.py --net "vit_tiny" --set_seed 0 --save_net "vit_tiny_torch_pair256_resolution9_max_degree_4_lambda_2.0_lr_0.005_random_sum" --plot_path "./images/wd_reg" --imgs 500,5000 --lr 0.005 --lambda_reg 2.0 --opt "AdamW" --epochs 300 --resolution 9 --max_degree 4 --use_data_aug --nums_pairs 256 --label --warmup_epochs_for_lambda 100 --random_sum


python train_wd_regular_torch.py --net "vit_tiny" --set_seed 0 --save_net "vit_tiny_torch_pair256_resolution30_max_degree_15_lambda_2.0_lr_0.005_pca" --plot_path "./images/wd_reg" --imgs 500,5000 --lr 0.005 --lambda_reg 2.0 --opt "AdamW" --epochs 300 --resolution 30 --max_degree 15 --use_data_aug --nums_pairs 256 --label --warmup_epochs_for_lambda 100 --pca

python test.py  --net 'vit_tiny' --set_seed 0 --load_net 'saved_models/corr_vit_tiny/0/vit_tiny_lr0_1_bs256_wd1e-5.pth' --epochs 400  --resolution 100 --imgs 500,5000

python test.py  --net 'resnet' --set_seed 0 --load_net 'saved_models/corr_resnet/0/resnet_lr0_1_bs256_wd1e-5.pth' --epochs 400  --resolution 100 --imgs 500,5000

python ./poly/wd_plot.py --net "resnet" --set_seed 0 --load_net './saved_models/corr_resnet/0/resnet_lr0_001_bs512_wd1e-6.pth' --epochs 50  --resolution 300 --imgs 500,5000

python ./poly/wd_plot.py --net "resnet" --set_seed 0 --load_net './saved_models/corr_resnet/0/resnet_lr0_1_bs256_wd1e-6.pth' --epochs 50  --resolution 300 --imgs 500,5000

# imagenet corr
python generalization_gap.py \
    --model-path "models/model_0.pt" \
    --data-location "/newdata_nvme/datasets/xxx/imagenet" \
    --results-file individual_model_results.jsonl

python wd_for_imagenet.py \
    --model_path "models/model_0.pt" \
    --split "train"\
    --repeats 100 \
    --resolution 200\
    --pca_dim 1\
    --gpu 1

python sharpness/eval_sharpness_imagenet.py \
  --data_location /newdata_nvme/datasets/xxx/imagenet \
  --model_path ./model-soups/models/model_0.pt \
  --clip_backbone ViT-B/32 \
  --rho 0.05 \
  --subset_size 2048 \
  --batch_size 256

# baseline
python train_wd_regular_torch.py --net "vit_tiny" --set_seed 0 --save_net "vit_tiny_baseline_seed_0" --plot_path "./images/wd_reg" --imgs 500,5000 --lr 0.005 --lambda_reg -1 --opt "AdamW" --epochs 300 --use_data_aug --nums_pairs 1 --resolution 4 --max_degree 2

python train_wd_regular_torch.py --net "vit_tiny" --set_seed 1 --save_net "vit_tiny_baseline_seed_1" --plot_path "./images/wd_reg" --imgs 500,5000 --lr 0.005 --lambda_reg -1 --opt "AdamW" --epochs 300 --use_data_aug --nums_pairs 1 --resolution 4 --max_degree 2

python train_wd_regular_torch.py --net "vit_tiny" --set_seed 2 --save_net "vit_tiny_baseline_seed_2" --plot_path "./images/wd_reg" --imgs 500,5000 --lr 0.005 --lambda_reg -1 --opt "AdamW" --epochs 300 --use_data_aug --nums_pairs 1 --resolution 4 --max_degree 2

# mixup resolution 1
python train_mixup.py --net "vit_tiny" --set_seed 0 --save_net "vit_tiny_mixup_alpha_1_resolution_1_seed_0" --plot_path "./images/wd_reg" --imgs 500,5000 --lr 0.005 --opt "AdamW" --epochs 300 --use_data_aug --mixup_alpha 1.0 --resolution 1

python train_mixup.py --net "vit_tiny" --set_seed 1 --save_net "vit_tiny_mixup_alpha_1_resolution_1_seed_1" --plot_path "./images/wd_reg" --imgs 500,5000 --lr 0.005 --opt "AdamW" --epochs 300 --use_data_aug --mixup_alpha 1.0 --resolution 1

python train_mixup.py --net "vit_tiny" --set_seed 2 --save_net "vit_tiny_mixup_alpha_1_resolution_1_seed_2" --plot_path "./images/wd_reg" --imgs 500,5000 --lr 0.005 --opt "AdamW" --epochs 300 --use_data_aug --mixup_alpha 1.0 --resolution 1

# mixup resolution 2
python train_mixup.py --net "vit_tiny" --set_seed 0 --save_net "vit_tiny_mixup_alpha_1_resolution_2_seed_0" --plot_path "./images/wd_reg" --imgs 500,5000 --lr 0.005 --opt "AdamW" --epochs 300 --use_data_aug --mixup_alpha 1.0 --resolution 2

python train_mixup.py --net "vit_tiny" --set_seed 1 --save_net "vit_tiny_mixup_alpha_1_resolution_2_seed_1" --plot_path "./images/wd_reg" --imgs 500,5000 --lr 0.005 --opt "AdamW" --epochs 300 --use_data_aug --mixup_alpha 1.0 --resolution 2

python train_mixup.py --net "vit_tiny" --set_seed 2 --save_net "vit_tiny_mixup_alpha_1_resolution_2_seed_2" --plot_path "./images/wd_reg" --imgs 500,5000 --lr 0.005 --opt "AdamW" --epochs 300 --use_data_aug --mixup_alpha 1.0 --resolution 2

# mixup resolution 3
python train_mixup.py --net "vit_tiny" --set_seed 0 --save_net "vit_tiny_mixup_alpha_1_resolution_3_seed_0" --plot_path "./images/wd_reg" --imgs 500,5000 --lr 0.005 --opt "AdamW" --epochs 300 --use_data_aug --mixup_alpha 1.0 --resolution 3

python train_mixup.py --net "vit_tiny" --set_seed 1 --save_net "vit_tiny_mixup_alpha_1_resolution_3_seed_1" --plot_path "./images/wd_reg" --imgs 500,5000 --lr 0.005 --opt "AdamW" --epochs 300 --use_data_aug --mixup_alpha 1.0 --resolution 3

python train_mixup.py --net "vit_tiny" --set_seed 2 --save_net "vit_tiny_mixup_alpha_1_resolution_3_seed_2" --plot_path "./images/wd_reg" --imgs 500,5000 --lr 0.005 --opt "AdamW" --epochs 300 --use_data_aug --mixup_alpha 1.0 --resolution 3

# sam
python train_sam.py --net "vit_tiny" --set_seed 1 --save_net "vit_tiny_sam_rho_0.2_seed_1" --plot_path "./images/wd_reg" --imgs 500,5000 --lr 0.005 --opt "AdamW" --epochs 300 --use_data_aug --sam --rho 0.2

python train_sam.py --net "vit_tiny" --set_seed 2 --save_net "vit_tiny_sam_rho_0.2_seed_2" --plot_path "./images/wd_reg" --imgs 500,5000 --lr 0.005 --opt "AdamW" --epochs 300 --use_data_aug --sam --rho 0.2

python train_sam.py --net "vit_tiny" --set_seed 1 --save_net "vit_tiny_sam_rho_0.1_seed_1" --plot_path "./images/wd_reg" --imgs 500,5000 --lr 0.005 --opt "AdamW" --epochs 300 --use_data_aug --sam --rho 0.1

python train_sam.py --net "vit_tiny" --set_seed 2 --save_net "vit_tiny_sam_rho_0.1_seed_2" --plot_path "./images/wd_reg" --imgs 500,5000 --lr 0.005 --opt "AdamW" --epochs 300 --use_data_aug --sam --rho 0.1

# asam
python train_sam.py --net "vit_tiny" --set_seed 1 --save_net "vit_tiny_asam_rho_0.5_seed_1" --plot_path "./images/wd_reg" --imgs 500,5000 --lr 0.005 --opt "AdamW" --epochs 300 --use_data_aug --sam --adaptive_sam --rho 0.5

python train_sam.py --net "vit_tiny" --set_seed 2 --save_net "vit_tiny_asam_rho_0.5_seed_2" --plot_path "./images/wd_reg" --imgs 500,5000 --lr 0.005 --opt "AdamW" --epochs 300 --use_data_aug --sam --adaptive_sam --rho 0.5

# no aug sam
python train_sam.py --net "vit_tiny" --set_seed 0 --save_net "vit_tiny_no_aug_sam_rho_0.2_seed_0" --plot_path "./images/wd_reg" --imgs 500,5000 --lr 0.005 --opt "AdamW" --epochs 300 --sam --rho 0.2

python train_sam.py --net "vit_tiny" --set_seed 1 --save_net "vit_tiny_no_aug_sam_rho_0.2_seed_1" --plot_path "./images/wd_reg" --imgs 500,5000 --lr 0.005 --opt "AdamW" --epochs 300 --sam --rho 0.2

python train_sam.py --net "vit_tiny" --set_seed 2 --save_net "vit_tiny_no_aug_sam_rho_0.2_seed_2" --plot_path "./images/wd_reg" --imgs 500,5000 --lr 0.005 --opt "AdamW" --epochs 300 --sam --rho 0.2

# baseline
python train_wd_regular_torch.py --net "vit_tiny" --set_seed 0 --save_net "vit_tiny_baseline_no_aug_seed_0" --plot_path "./images/wd_reg" --imgs 500,5000 --lr 0.005 --lambda_reg -1 --opt "AdamW" --epochs 300 --nums_pairs 1 --resolution 4 --max_degree 2

python train_wd_regular_torch.py --net "vit_tiny" --set_seed 1 --save_net "vit_tiny_baseline_no_aug_seed_1" --plot_path "./images/wd_reg" --imgs 500,5000 --lr 0.005 --lambda_reg -1 --opt "AdamW" --epochs 300 --nums_pairs 1 --resolution 4 --max_degree 2

python train_wd_regular_torch.py --net "vit_tiny" --set_seed 2 --save_net "vit_tiny_baseline_no_aug_seed_2" --plot_path "./images/wd_reg" --imgs 500,5000 --lr 0.005 --lambda_reg -1 --opt "AdamW" --epochs 300 --nums_pairs 1 --resolution 4 --max_degree 2

# baseline use sam
python train_sam.py --net "vit_tiny" --set_seed 0 --save_net "vit_tiny_no_aug_no_sam_rho_0.2_seed_0" --plot_path "./images/wd_reg" --imgs 500,5000 --lr 0.005 --opt "AdamW" --epochs 300 --rho 0.2

python train_sam.py --net "vit_tiny" --set_seed 1 --save_net "vit_tiny_no_aug_no_sam_rho_0.2_seed_1" --plot_path "./images/wd_reg" --imgs 500,5000 --lr 0.005 --opt "AdamW" --epochs 300 --rho 0.2

python train_sam.py --net "vit_tiny" --set_seed 2 --save_net "vit_tiny_no_aug_no_sam_rho_0.2_seed_2" --plot_path "./images/wd_reg" --imgs 500,5000 --lr 0.005 --opt "AdamW" --epochs 300 --rho 0.2

# sam 0.1
python train_sam.py --net "vit_tiny" --set_seed 1 --save_net "vit_tiny_no_aug_sam_rho_0.1_seed_1" --plot_path "./images/wd_reg" --imgs 500,5000 --lr 0.005 --opt "AdamW" --epochs 300 --sam --rho 0.1

python train_sam.py --net "vit_tiny" --set_seed 2 --save_net "vit_tiny_no_aug_sam_rho_0.1_seed_2" --plot_path "./images/wd_reg" --imgs 500,5000 --lr 0.005 --opt "AdamW" --epochs 300 --sam --rho 0.1

# mixup resolution 1
python train_mixup.py --net "vit_tiny" --set_seed 0 --save_net "vit_tiny_mixup_no_aug_alpha_1_resolution_1_seed_0" --plot_path "./images/wd_reg" --imgs 500,5000 --lr 0.005 --opt "AdamW" --epochs 300 --mixup_alpha 1.0 --resolution 1

python train_mixup.py --net "vit_tiny" --set_seed 1 --save_net "vit_tiny_mixup_no_aug_alpha_1_resolution_1_seed_1" --plot_path "./images/wd_reg" --imgs 500,5000 --lr 0.005 --opt "AdamW" --epochs 300 --mixup_alpha 1.0 --resolution 1

python train_mixup.py --net "vit_tiny" --set_seed 2 --save_net "vit_tiny_mixup_no_aug_alpha_1_resolution_1_seed_2" --plot_path "./images/wd_reg" --imgs 500,5000 --lr 0.005 --opt "AdamW" --epochs 300 --mixup_alpha 1.0 --resolution 1

# wd
python train_wd_regular_torch.py --net "vit_tiny" --set_seed 0 --save_net "vit_tiny_torch_no_aug_pair256_resolution15_max_degree_7_lambda_2.0_lr_0.005_seed_0" --plot_path "./images/wd_reg" --imgs 500,5000 --lr 0.005 --lambda_reg 2.0 --opt "AdamW" --epochs 300 --resolution 15 --max_degree 7 --nums_pairs 256 --label --warmup_epochs_for_lambda 100

python train_wd_regular_torch.py --net "vit_tiny" --set_seed 1 --save_net "vit_tiny_torch_no_aug_pair256_resolution15_max_degree_7_lambda_2.0_lr_0.005_seed_1" --plot_path "./images/wd_reg" --imgs 500,5000 --lr 0.005 --lambda_reg 2.0 --opt "AdamW" --epochs 300 --resolution 15 --max_degree 7 --nums_pairs 256 --label --warmup_epochs_for_lambda 100

python train_wd_regular_torch.py --net "vit_tiny" --set_seed 2 --save_net "vit_tiny_torch_no_aug_pair256_resolution15_max_degree_7_lambda_2.0_lr_0.005_seed_2" --plot_path "./images/wd_reg" --imgs 500,5000 --lr 0.005 --lambda_reg 2.0 --opt "AdamW" --epochs 300 --resolution 15 --max_degree 7 --nums_pairs 256 --label --warmup_epochs_for_lambda 100

# asam
python train_sam.py --net "vit_tiny" --set_seed 1 --save_net "vit_tiny_no_aug_asam_rho_0.002_seed_1" --plot_path "./images/wd_reg" --imgs 500,5000 --lr 0.005 --opt "AdamW" --epochs 300 --sam --adaptive_sam --rho 0.002

python train_sam.py --net "vit_tiny" --set_seed 2 --save_net "vit_tiny_no_aug_asam_rho_0.002_seed_2" --plot_path "./images/wd_reg" --imgs 500,5000 --lr 0.005 --opt "AdamW" --epochs 300 --sam --adaptive_sam --rho 0.002


python train_wd_regular_torch.py --net "vit_tiny" --set_seed 0 --save_net "vit_tiny_torch_no_aug_pair256_resolution10_max_degree_5_lambda_2.0_lr_0.005_seed_0" --plot_path "./images/wd_reg" --imgs 500,5000 --lr 0.005 --lambda_reg 2.0 --opt "AdamW" --epochs 300 --resolution 10 --max_degree 5 --nums_pairs 256 --label --warmup_epochs_for_lambda 100

python train_wd_regular_torch.py --net "vit_tiny" --set_seed 0 --save_net "vit_tiny_torch_no_aug_pair256_resolution7_max_degree_3_lambda_2.0_lr_0.005_seed_0" --plot_path "./images/wd_reg" --imgs 500,5000 --lr 0.005 --lambda_reg 2.0 --opt "AdamW" --epochs 300 --resolution 7 --max_degree 3 --nums_pairs 256 --label --warmup_epochs_for_lambda 100

python train_wd_regular_torch.py --net "vit_tiny" --set_seed 0 --save_net "vit_tiny_torch_no_aug_pair256_resolution4_max_degree_2_lambda_2.0_lr_0.005_seed_0" --plot_path "./images/wd_reg" --imgs 500,5000 --lr 0.005 --lambda_reg 2.0 --opt "AdamW" --epochs 300 --resolution 4 --max_degree 2 --nums_pairs 256 --label --warmup_epochs_for_lambda 100

python train_wd_regular_torch.py --net "vit_tiny" --set_seed 0 --save_net "vit_tiny_torch_no_aug_pair256_resolution20_max_degree_10_lambda_2.0_lr_0.005_seed_0" --plot_path "./images/wd_reg" --imgs 500,5000 --lr 0.005 --lambda_reg 2.0 --opt "AdamW" --epochs 300 --resolution 20 --max_degree 10 --nums_pairs 256 --label --warmup_epochs_for_lambda 100

python train_wd_regular_torch.py --net "vit_tiny" --set_seed 1 --save_net "vit_tiny_torch_no_aug_pair256_resolution20_max_degree_10_lambda_2.0_lr_0.005_seed_1" --plot_path "./images/wd_reg" --imgs 500,5000 --lr 0.005 --lambda_reg 2.0 --opt "AdamW" --epochs 300 --resolution 20 --max_degree 10 --nums_pairs 256 --label --warmup_epochs_for_lambda 100

python train_wd_regular_torch.py --net "vit_tiny" --set_seed 2 --save_net "vit_tiny_torch_no_aug_pair256_resolution20_max_degree_10_lambda_2.0_lr_0.005_seed_2" --plot_path "./images/wd_reg" --imgs 500,5000 --lr 0.005 --lambda_reg 2.0 --opt "AdamW" --epochs 300 --resolution 20 --max_degree 10 --nums_pairs 256 --label --warmup_epochs_for_lambda 100

# ablation
# wd
python train_wd_regular_torch.py --net "vit_tiny" --set_seed 0 --save_net "vit_tiny_torch_aug_noise_pair256_resolution15_max_degree_7_lambda_2.0_no_label_lr_0.005_seed_0" --plot_path "./images/wd_reg" --imgs 500,5000 --use_data_aug --lr 0.005 --lambda_reg 2.0 --opt "AdamW" --epochs 300 --resolution 15 --max_degree 7 --nums_pairs 256 --use_noise --warmup_epochs_for_lambda 100

python train_wd_regular_torch.py --net "vit_tiny" --set_seed 1 --save_net "vit_tiny_torch_aug_noise_pair256_resolution15_max_degree_7_lambda_2.0_no_label_lr_0.005_seed_1" --plot_path "./images/wd_reg" --imgs 500,5000 --use_data_aug --lr 0.005 --lambda_reg 2.0 --opt "AdamW" --epochs 300 --resolution 15 --max_degree 7 --nums_pairs 256 --use_noise --warmup_epochs_for_lambda 100

python train_wd_regular_torch.py --net "vit_tiny" --set_seed 2 --save_net "vit_tiny_torch_aug_noise_pair256_resolution15_max_degree_7_lambda_2.0_no_label_lr_0.005_seed_2" --plot_path "./images/wd_reg" --imgs 500,5000 --use_data_aug --lr 0.005 --lambda_reg 2.0 --opt "AdamW" --epochs 300 --resolution 15 --max_degree 7 --nums_pairs 256 --use_noise --warmup_epochs_for_lambda 100