Mist: Efficient Distributed Training of Large Language Models via Memory-Parallelism Co-Optimization | OpenReview

Mist: Efficient Distributed Training of Large Language Models via Memory-Parallelism Co-Optimization

Open Webpage

Zhanda Zhu, Christina Giannoula, Muralidhar Andoorveedu, Qidong Su, Karttikeya Mangalam, Bojian Zheng, Gennady Pekhimenko

Published: 01 Jan 2025, Last Modified: 23 Apr 2025EuroSys 2025EveryoneRevisionsBibTeXCC BY-SA 4.0

Loading