星期六, 7 6 月, 2025
No Result
View All Result
AI TAIWAN 台灣人工智慧中心
  • Home
  • AI 綜合新聞
  • AI 自動化與 AI Agents
  • AI 智慧產業
  • 機器學習與應用
  • 自然語言處理
  • 神經連結和腦機接口
  • 機器人與自動化
  • 道德與法規
  • 安全
AI TAIWAN 台灣人工智慧中心
  • Home
  • AI 綜合新聞
  • AI 自動化與 AI Agents
  • AI 智慧產業
  • 機器學習與應用
  • 自然語言處理
  • 神經連結和腦機接口
  • 機器人與自動化
  • 道德與法規
  • 安全
No Result
View All Result
AI TAIWAN 台灣人工智慧中心
No Result
View All Result
Your Ad
Home 機器學習與應用

字節跳動AI推出Doubao-1.5-Pro語言模型,具備「深度思考」模式,並以50倍更低的價格匹配GPT 4o和Claude 3.5的Sonnet基準。

2025-01-26
in 機器學習與應用
0 0
0
字節跳動AI推出Doubao-1.5-Pro語言模型,具備「深度思考」模式,並以50倍更低的價格匹配GPT 4o和Claude 3.5的Sonnet基準。
Share on FacebookShare on Twitter
Your Ad


人工智慧 (AI) 的發展速度非常快,但這樣的成長也帶來了不少挑戰。開發和部署大型 AI 模型的高成本,以及實現可靠推理能力的困難,都是主要問題。像是 OpenAI 的 GPT-4 和 Anthropic 的 Claude 等模型,已經突破了 AI 的界限,但它們資源需求高,讓許多組織無法負擔。此外,長文本理解的問題,以及計算效率和準確性之間的平衡,仍然是未解決的挑戰。這些障礙顯示出需要既具成本效益又能夠不犧牲性能的解決方案。

為了解決這些挑戰,字節跳動 (ByteDance) 推出了 Doubao-1.5-pro,這是一個配備「深度思考」模式的 AI 模型。這個模型的表現與 GPT-4o 和 Claude 3.5 Sonnet 等已建立的競爭對手相當,但成本卻低得多。它的定價非常吸引人,每百萬個快取輸入標記的價格是 $0.022,每百萬個輸入標記的價格是 $0.11,每百萬個輸出標記的價格是 $0.275。除了價格實惠外,Doubao-1.5-pro 在關鍵基準測試中,如 AIME 測試,表現超過了深度搜尋 (deepseek-v3) 和 llama3.1-405B 等模型。這一發展是字節跳動更廣泛努力的一部分,旨在讓先進的 AI 能力變得更可及,反映出 AI 行業對成本效益創新的日益重視。

技術亮點和優勢

Doubao-1.5-pro 的強大性能源於其深思熟慮的設計和架構。這個模型採用了稀疏的專家混合 (Mixture-of-Experts, MoE) 框架,在推理時只激活部分參數。這種方法使其能夠在計算負擔僅為一小部分的情況下,提供與密集模型相當的性能。例如,Doubao-1.5-pro 中激活的 200 億個參數,相當於一個 1400 億參數的密集模型的性能。這種效率降低了運營成本,並提高了可擴展性。

該模型還整合了異構系統設計,用於預填充解碼和注意力-前饋網絡 (attention-FFN) 任務,優化了吞吐量並最小化延遲。此外,其擴展的上下文窗口可達 32,000 到 256,000 個標記,使其能更有效地處理長文本,成為法律文件分析、學術研究和客戶服務等應用的寶貴工具。

結果和見解

性能數據突顯了 Doubao-1.5-pro 在 AI 領域的競爭力。它在推理任務中與 GPT-4o 相當,並在 AIME 等基準測試中超越了早期模型,包括 O1-preview 和 O1。其成本效益也是一個重要優勢,運營費用比 DeepSeek 低 5 倍,比 OpenAI 的 O1 模型低超過 200 倍。這些因素強調了字節跳動提供一個結合強大性能和經濟實惠的模型的能力。

早期用戶指出,「深度思考」模式的有效性,這增強了推理能力,對於需要複雜問題解決的任務非常有價值。這種技術創新與成本意識的設計相結合,使 Doubao-1.5-pro 成為各行各業的實用解決方案。

結論

Doubao-1.5-pro 展示了一種平衡的方法來解決 AI 開發中的挑戰,提供了性能、成本效益和可及性的結合。其稀疏的專家混合架構和高效的系統設計,為像 GPT-4 和 Claude 等更資源密集的模型提供了一個引人注目的替代方案。通過優先考慮經濟實惠和可用性,字節跳動的最新模型有助於讓先進的 AI 工具變得更廣泛可用。這標誌著 AI 開發的一個重要進步,反映出朝著創造滿足不同用戶和組織需求的解決方案的更廣泛轉變。



新聞來源

本文由 AI 台灣 運用 AI 技術編撰,內容僅供參考,請自行核實相關資訊。
歡迎加入我們的 AI TAIWAN 台灣人工智慧中心 FB 社團,
隨時掌握最新 AI 動態與實用資訊!

Tags: 3.5的Sonnet基準4o和Claude字節跳動AI推出Doubao1.5Pro語言模型具備深度思考模式並以50倍更低的價格匹配GPT
Previous Post

DeepSeek-R1 與 OpenAI 的 o1:開源與專有模型的新一步

Next Post

使用Python優化預算與行銷混合模型 | Ryan O’Sullivan著 | 2025年1月

Related Posts

劍橋大學和莫納什大學的研究人員推出 ReasonGraph:一個可視化和分析大型語言模型推理過程的網絡平台
機器學習與應用

劍橋大學和莫納什大學的研究人員推出 ReasonGraph:一個可視化和分析大型語言模型推理過程的網絡平台

2025-03-16
生成式人工智慧的影響及其對數據科學家的啟示
機器學習與應用

生成式人工智慧的影響及其對數據科學家的啟示

2025-03-15
這篇AI論文介紹了BD3-LMs:一種結合自回歸模型和擴散模型的混合方法,用於可擴展和高效的文本生成
機器學習與應用

這篇AI論文介紹了BD3-LMs:一種結合自回歸模型和擴散模型的混合方法,用於可擴展和高效的文本生成

2025-03-15
九個生鏽的Pico PIO瓦特(第二部分)
機器學習與應用

九個生鏽的Pico PIO瓦特(第二部分)

2025-03-15
開始使用 Amazon Bedrock Agents 的電腦操作
機器學習與應用

開始使用 Amazon Bedrock Agents 的電腦操作

2025-03-15
評估使用 Amazon Bedrock 知識庫的 RAG 應用程式
機器學習與應用

評估使用 Amazon Bedrock 知識庫的 RAG 應用程式

2025-03-14
Next Post
使用Python優化預算與行銷混合模型 | Ryan O’Sullivan著 | 2025年1月

使用Python優化預算與行銷混合模型 | Ryan O'Sullivan著 | 2025年1月

你的神經網絡無法解釋這個。TMLE來拯救! | 作者:Ari Joury, PhD | 2025年1月

你的神經網絡無法解釋這個。TMLE來拯救! | 作者:Ari Joury, PhD | 2025年1月

發佈留言 取消回覆

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *

Archives

  • 2025 年 4 月
  • 2025 年 3 月
  • 2025 年 2 月
  • 2025 年 1 月
  • 2024 年 12 月
  • 2024 年 11 月
  • 2024 年 10 月
  • 2024 年 9 月
  • 2024 年 8 月
  • 2024 年 7 月
  • 2024 年 6 月
  • 2024 年 5 月
  • 2024 年 4 月
  • 2024 年 3 月
  • 2024 年 2 月
  • 2023 年 10 月
  • 2023 年 9 月
  • 2023 年 8 月
  • 2023 年 7 月
  • 2023 年 5 月
  • 2023 年 3 月
  • 2023 年 1 月
  • 2022 年 12 月
  • 2022 年 11 月
  • 2022 年 5 月
  • 2022 年 4 月
  • 2022 年 1 月
  • 2021 年 11 月
  • 2021 年 8 月
  • 2021 年 5 月
  • 2021 年 3 月
  • 2021 年 1 月
  • 2020 年 12 月
  • 2020 年 10 月
  • 2020 年 9 月
  • 2019 年 7 月
  • 2018 年 11 月

Categories

  • AI 智慧產業
  • AI 綜合新聞
  • AI 自動化與 AI Agents
  • 安全
  • 機器人與自動化
  • 機器學習與應用
  • 神經連結和腦機接口
  • 自然語言處理
  • 道德與法規
Your Ad
  • 關於我們
  • 廣告合作
  • 免責聲明
  • 隱私權政策
  • DMCA
  • Cookie 隱私權政策
  • 條款與條件
  • 聯絡我們
AI TAIWAN

版權 © 2024 AI TAIWAN.
AI TAIWAN 對外部網站的內容不負任何責任。

Welcome Back!

Login to your account below

Forgotten Password?

Retrieve your password

Please enter your username or email address to reset your password.

Log In
No Result
View All Result
  • Home
  • AI 綜合新聞
  • AI 自動化與 AI Agents
  • AI 智慧產業
  • 機器學習與應用
  • 自然語言處理
  • 神經連結和腦機接口
  • 機器人與自動化
  • 道德與法規
  • 安全

版權 © 2024 AI TAIWAN.
AI TAIWAN 對外部網站的內容不負任何責任。