llm_params:
  device: 'cuda:1'
  freeze: false
  dtype: bfloat16
allow_non_ascii: false
gen_params:
  do_sample: true
  temperature: 1.0
  top_p: 0.9