標籤: 微軟研究人員提出MHMoE的新實現在稀疏專家混合模型中實現FLOPs和參數平衡