星期四, 31 7 月, 2025
No Result
View All Result
AI TAIWAN 台灣人工智慧中心
  • Home
  • AI 綜合新聞
  • AI 自動化與 AI Agents
  • AI 智慧產業
  • 機器學習與應用
  • 自然語言處理
  • 神經連結和腦機接口
  • 機器人與自動化
  • 道德與法規
  • 安全
AI TAIWAN 台灣人工智慧中心
  • Home
  • AI 綜合新聞
  • AI 自動化與 AI Agents
  • AI 智慧產業
  • 機器學習與應用
  • 自然語言處理
  • 神經連結和腦機接口
  • 機器人與自動化
  • 道德與法規
  • 安全
No Result
View All Result
AI TAIWAN 台灣人工智慧中心
No Result
View All Result
Your Ad
Home 機器學習與應用

Qwen AI 推出 Qwen2.5-Max:一個大型 MoE LLM,經過海量數據預訓練,並以精選 SFT 和 RLHF 配方進行後訓練

2025-01-29
in 機器學習與應用
0 0
0
Qwen AI 推出 Qwen2.5-Max:一個大型 MoE LLM,經過海量數據預訓練,並以精選 SFT 和 RLHF 配方進行後訓練
Share on FacebookShare on Twitter
Your Ad


人工智慧的領域正在快速發展,越來越多的努力致力於開發更強大和高效的語言模型。然而,擴大這些模型的規模面臨挑戰,特別是在計算資源和訓練的複雜性方面。研究界仍在探索擴展極大型模型的最佳實踐,無論它們使用的是密集型架構還是專家混合架構(Mixture-of-Experts, MoE)。直到最近,關於這個過程的許多細節並未廣泛分享,這使得改進大型人工智慧系統變得困難。

Qwen AI旨在通過Qwen2.5-Max來解決這些挑戰,這是一個大型的MoE模型,預訓練於超過20萬億個標記,並通過監督微調(Supervised Fine-Tuning, SFT)和來自人類反饋的強化學習(Reinforcement Learning from Human Feedback, RLHF)進一步精煉。這種方法微調模型,使其更好地符合人類的期望,同時保持擴展的效率。

從技術上講,Qwen2.5-Max利用了專家混合架構,這使得它在推理過程中只激活一部分參數。這樣可以優化計算效率,同時保持性能。廣泛的預訓練階段提供了強大的知識基礎,而SFT和RLHF則進一步提升了模型生成連貫和相關回應的能力。這些技術有助於改善模型在各種應用中的推理能力和可用性。

Qwen2.5-Max已在MMLU-Pro、LiveCodeBench、LiveBench和Arena-Hard等基準測試中與領先模型進行了評估。結果顯示,它的表現具有競爭力,在Arena-Hard、LiveBench、LiveCodeBench和GPQA-Diamond等測試中超越了DeepSeek V3。它在MMLU-Pro上的表現也很強,突顯了它在知識檢索、編碼任務和更廣泛的人工智慧應用中的能力。

總結來說,Qwen2.5-Max提供了一種深思熟慮的擴展語言模型的方法,同時保持效率和性能。通過利用MoE架構和戰略性的後期訓練方法,它解決了人工智慧模型開發中的關鍵挑戰。隨著人工智慧研究的進展,像Qwen2.5-Max這樣的模型展示了如何通過深思熟慮的數據使用和訓練技術來實現更強大和可靠的人工智慧系統。

可以在Hugging Face上查看演示和技術細節。這項研究的所有功勞都歸於這個項目的研究人員。此外,別忘了在Twitter上關注我們,並加入我們的Telegram頻道和LinkedIn小組。還有,別忘了加入我們的70k+ ML SubReddit。

🚨 [推薦閱讀] Nebius AI Studio擴展視覺模型、新語言模型、嵌入和LoRA(推廣)



新聞來源

本文由 AI 台灣 運用 AI 技術編撰,內容僅供參考,請自行核實相關資訊。
歡迎加入我們的 AI TAIWAN 台灣人工智慧中心 FB 社團,
隨時掌握最新 AI 動態與實用資訊!

Tags: LLM經過海量數據預訓練並以精選MoEQwenQwen2.5Max一個大型RLHFSFT和推出配方進行後訓練
Previous Post

Qwen AI 發布 Qwen2.5-VL:一個強大的視覺語言模型,實現無縫的電腦互動

Next Post

保護公司數據資產依賴於技術和人力雙方

Related Posts

劍橋大學和莫納什大學的研究人員推出 ReasonGraph:一個可視化和分析大型語言模型推理過程的網絡平台
機器學習與應用

劍橋大學和莫納什大學的研究人員推出 ReasonGraph:一個可視化和分析大型語言模型推理過程的網絡平台

2025-03-16
生成式人工智慧的影響及其對數據科學家的啟示
機器學習與應用

生成式人工智慧的影響及其對數據科學家的啟示

2025-03-15
這篇AI論文介紹了BD3-LMs:一種結合自回歸模型和擴散模型的混合方法,用於可擴展和高效的文本生成
機器學習與應用

這篇AI論文介紹了BD3-LMs:一種結合自回歸模型和擴散模型的混合方法,用於可擴展和高效的文本生成

2025-03-15
九個生鏽的Pico PIO瓦特(第二部分)
機器學習與應用

九個生鏽的Pico PIO瓦特(第二部分)

2025-03-15
開始使用 Amazon Bedrock Agents 的電腦操作
機器學習與應用

開始使用 Amazon Bedrock Agents 的電腦操作

2025-03-15
評估使用 Amazon Bedrock 知識庫的 RAG 應用程式
機器學習與應用

評估使用 Amazon Bedrock 知識庫的 RAG 應用程式

2025-03-14
Next Post
保護公司數據資產依賴於技術和人力雙方

保護公司數據資產依賴於技術和人力雙方

Qwen 2.5-Max在某些基準測試中超越了DeepSeek V3

Qwen 2.5-Max在某些基準測試中超越了DeepSeek V3

發佈留言 取消回覆

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *

Archives

  • 2025 年 6 月
  • 2025 年 4 月
  • 2025 年 3 月
  • 2025 年 2 月
  • 2025 年 1 月
  • 2024 年 12 月
  • 2024 年 11 月
  • 2024 年 10 月
  • 2024 年 9 月
  • 2024 年 8 月
  • 2024 年 7 月
  • 2024 年 6 月
  • 2024 年 5 月
  • 2024 年 4 月
  • 2024 年 3 月
  • 2024 年 2 月
  • 2023 年 10 月
  • 2023 年 9 月
  • 2023 年 8 月
  • 2023 年 7 月
  • 2023 年 5 月
  • 2023 年 3 月
  • 2023 年 1 月
  • 2022 年 12 月
  • 2022 年 11 月
  • 2022 年 5 月
  • 2022 年 4 月
  • 2022 年 1 月
  • 2021 年 11 月
  • 2021 年 8 月
  • 2021 年 5 月
  • 2021 年 3 月
  • 2021 年 1 月
  • 2020 年 12 月
  • 2020 年 10 月
  • 2020 年 9 月
  • 2019 年 7 月
  • 2018 年 11 月

Categories

  • AI 智慧產業
  • AI 綜合新聞
  • AI 自動化與 AI Agents
  • 安全
  • 機器人與自動化
  • 機器學習與應用
  • 神經連結和腦機接口
  • 自然語言處理
  • 道德與法規
Your Ad
  • 關於我們
  • 廣告合作
  • 免責聲明
  • 隱私權政策
  • DMCA
  • Cookie 隱私權政策
  • 條款與條件
  • 聯絡我們
AI TAIWAN

版權 © 2024 AI TAIWAN.
AI TAIWAN 對外部網站的內容不負任何責任。

Welcome Back!

Login to your account below

Forgotten Password?

Retrieve your password

Please enter your username or email address to reset your password.

Log In
No Result
View All Result
  • Home
  • AI 綜合新聞
  • AI 自動化與 AI Agents
  • AI 智慧產業
  • 機器學習與應用
  • 自然語言處理
  • 神經連結和腦機接口
  • 機器人與自動化
  • 道德與法規
  • 安全

版權 © 2024 AI TAIWAN.
AI TAIWAN 對外部網站的內容不負任何責任。