ToMoE: Converting Dense Large Language Models to Mixture-of-Experts through Dynamic Structural Pruning | OpenReview

ToMoE: Converting Dense Large Language Models to Mixture-of-Experts through Dynamic Structural Pruning

Open Webpage

Shangqian Gao, Ting Hua, Reza Shirkavand, Chi-Heng Lin, Zheng Tang, Zhengao Li, Longge Yuan, Fangyi Li, Zeyu Zhang, Alireza Ganjdanesh, Qian Lou, Jie Xu, Yen-Chang Hsu

Published: 2026, Last Modified: 17 Mar 2026Trans. Mach. Learn. Res. 2026EveryoneRevisionsBibTeXCC BY-SA 4.0

External IDs:dblp:journals/tmlr/GaoHSLTLYLZGLXH26

Loading