Maximizing Intermediate Checkpoint Value in LLM Pretraining with Bayesian Optimization | OpenReview

Maximizing Intermediate Checkpoint Value in LLM Pretraining with Bayesian Optimization

Open Webpage

Deyuan Liu, Zecheng Wang, Bingning Wang, Weipeng Chen, Chunshan Li, Zhiying Tu, Dianhui Chu, Dianbo Sui

Published: 2025, Last Modified: 21 Jan 2026ICML 2025EveryoneRevisionsBibTeXCC BY-SA 4.0

External IDs:dblp:conf/icml/LiuWWCLTCS25

Loading