algorithms:
  - name: OFUL
    params:
      delta: 0.1
      lam: 0.1
      S: 14.0
      L: 1.0

  - name: PO
    params:
      delta: 0.1
      q_list: 0.5
      lam: 0.1
      S: 14.0
      L: 1.0

  - name: SERMiSC
    params:
      T_1: 100
      pi_prime: [0.1, 0.1, 0.1, 0.1, 0.1, 0.1, 0.1, 0.1, 0.1, 0.1]
      delta: 0.1
      q_list: 0.5
      lam: 0.1
      S: 14.0
      L: 1.0
  

environment:
  T: 1000 
  K: 10 
  d: 8 
  arm_set: 
    - [1.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0]
    - [0.0, 1.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0]
    - [0.0, 0.0, 1.0, 0.0, 0.0, 0.0, 0.0, 0.0]
    - [0.0, 0.0, 0.0, 1.0, 0.0, 0.0, 0.0, 0.0]
    - [0.0, 0.0, 0.0, 0.0, 1.0, 0.0, 0.0, 0.0]
    - [0.0, 0.0, 0.0, 0.0, 0.0, 1.0, 0.0, 0.0]
    - [0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 1.0, 0.0]
    - [0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 1.0]
    - [0.1, 0.1, 0.1, 0.1, 0.1, 0.1, 0.1, 0.1]
    - [0.1, -0.1, -0.1, -0.1, -0.1, -0.1, -0.1, -0.1]
  sigma: 0.5

secrets:
  theta_star: [1.0, 5.0, -3.0, 0.2, 3.0, 3.0, -4.0, 9.0] 
  c_mean: [2.0, -2.0, -5.0, 0.0, 0.0, 0.0, 0.0, 4.0, 1.0, 1.0]
  c_sigma: 0.05

epoch_num: 10
seed: 44