#!/bin/bash

python main.py \
    --device "cuda:1" \
    --seed 128 \
    --model "../2.Bert/deberta-v3-base" \
    --dataset "mosei" \
    --max_seq_length 50 \
    --train_batch_size 32 \
    --dev_batch_size 128 \
    --test_batch_size 128 \
    --gradient_accumulation_step 1 \
    --warmup_proportion 0.1 \
    --n_epochs 15 \
    --learning_rate 1e-5 \
    --dropout_prob 0.1 \
    --hidden_dim 512 \
    --dim 512 \
    --output_dim 128 \
    --p_alpha 1.0 \
    --p_beta 1e-2 \
    --p_lambda1 1.0 \
    --p_lambda2 0.7 \