Qwen AI 推出 Qwen2.5-Max：一個大型 MoE LLM，經過海量數據預訓練，並以精選 SFT 和 RLHF 配方進行後訓練

人工智慧的領域正在快速發展，越來越多的努力致力於開發更強大和高效的語言模型。然而，擴大這些模型的規模面臨挑戰，特別是在計算資源和訓練的複雜性方面。研究界仍在探索擴展極大型模型的最佳實踐，無論它們使用的是密集型架構還是專家混合架構（Mixture-of-Experts, MoE）。直到最近，關於這個過程的許多細節並未廣泛分享，這使得改進大型人工智慧系統變得困難。

Qwen AI旨在通過Qwen2.5-Max來解決這些挑戰，這是一個大型的MoE模型，預訓練於超過20萬億個標記，並通過監督微調（Supervised Fine-Tuning, SFT）和來自人類反饋的強化學習（Reinforcement Learning from Human Feedback, RLHF）進一步精煉。這種方法微調模型，使其更好地符合人類的期望，同時保持擴展的效率。

從技術上講，Qwen2.5-Max利用了專家混合架構，這使得它在推理過程中只激活一部分參數。這樣可以優化計算效率，同時保持性能。廣泛的預訓練階段提供了強大的知識基礎，而SFT和RLHF則進一步提升了模型生成連貫和相關回應的能力。這些技術有助於改善模型在各種應用中的推理能力和可用性。

Qwen2.5-Max已在MMLU-Pro、LiveCodeBench、LiveBench和Arena-Hard等基準測試中與領先模型進行了評估。結果顯示，它的表現具有競爭力，在Arena-Hard、LiveBench、LiveCodeBench和GPQA-Diamond等測試中超越了DeepSeek V3。它在MMLU-Pro上的表現也很強，突顯了它在知識檢索、編碼任務和更廣泛的人工智慧應用中的能力。

總結來說，Qwen2.5-Max提供了一種深思熟慮的擴展語言模型的方法，同時保持效率和性能。通過利用MoE架構和戰略性的後期訓練方法，它解決了人工智慧模型開發中的關鍵挑戰。隨著人工智慧研究的進展，像Qwen2.5-Max這樣的模型展示了如何通過深思熟慮的數據使用和訓練技術來實現更強大和可靠的人工智慧系統。

可以在Hugging Face上查看演示和技術細節。這項研究的所有功勞都歸於這個項目的研究人員。此外，別忘了在Twitter上關注我們，並加入我們的Telegram頻道和LinkedIn小組。還有，別忘了加入我們的70k+ ML SubReddit。

🚨 [推薦閱讀] Nebius AI Studio擴展視覺模型、新語言模型、嵌入和LoRA（推廣）

新聞來源

本文由 AI 台灣 運用 AI 技術編撰，內容僅供參考，請自行核實相關資訊。
歡迎加入我們的 AI TAIWAN 台灣人工智慧中心 FB 社團，
隨時掌握最新 AI 動態與實用資訊！