星期四, 29 5 月, 2025
No Result
View All Result
AI TAIWAN 台灣人工智慧中心
  • Home
  • AI 綜合新聞
  • AI 自動化與 AI Agents
  • AI 智慧產業
  • 機器學習與應用
  • 自然語言處理
  • 神經連結和腦機接口
  • 機器人與自動化
  • 道德與法規
  • 安全
AI TAIWAN 台灣人工智慧中心
  • Home
  • AI 綜合新聞
  • AI 自動化與 AI Agents
  • AI 智慧產業
  • 機器學習與應用
  • 自然語言處理
  • 神經連結和腦機接口
  • 機器人與自動化
  • 道德與法規
  • 安全
No Result
View All Result
AI TAIWAN 台灣人工智慧中心
No Result
View All Result
Your Ad
Home AI 綜合新聞

DeepSeek 可能對能源來說並不是好消息

2025-02-01
in AI 綜合新聞
0 0
0
DeepSeek 可能對能源來說並不是好消息
Share on FacebookShare on Twitter
Your Ad


其他科技公司可能會效仿 DeepSeek 的方法

隨著 DeepSeek 的方法受到啟發,其他科技公司可能會開始建立類似的低成本推理模型,而能源消耗的前景看起來已經不那麼樂觀了。

人工智慧模型的生命週期

任何人工智慧模型的生命週期有兩個階段:訓練和推理。訓練是通常需要幾個月的過程,模型從數據中學習。然後,模型就準備進行推理,這發生在世界上任何人詢問它問題的時候。這兩個階段通常都在數據中心進行,運行晶片和冷卻伺服器需要大量的能源。

DeepSeek 的 R1 模型訓練改進

在訓練其 R1 模型的過程中,DeepSeek 的團隊改進了一種叫做「專家混合」的技術,這種技術在訓練期間只有一部分模型的數十億個參數——模型用來形成更好答案的「旋鈕」——在特定時間內被啟用。更值得注意的是,他們改進了強化學習,這是一種模型的輸出會被評分並用來改進模型的過程。這通常由人類標註者完成,但 DeepSeek 團隊在自動化這個過程上做得很好。

訓練效率的提高

引入提高訓練效率的方法可能暗示著人工智慧公司將使用更少的能源來達到某個標準。但實際上並不是這樣。

「因為擁有更智能系統的價值非常高,」Anthropic 共同創辦人 Dario Amodei 在他的部落格上寫道,這「使得公司在訓練模型上花費更多,而不是更少。」如果公司能夠獲得更多的價值,他們會覺得花更多錢是值得的,因此會使用更多的能源。他寫道:「成本效率的提高最終完全用於訓練更智能的模型,僅受限於公司的財務資源。」這是一個被稱為傑文斯悖論的例子。

推理階段的能源需求

但在人工智慧競賽中,這在訓練階段一直都是如此。推理所需的能源才是更有趣的地方。

DeepSeek 的推理模型設計

DeepSeek 被設計為推理模型,這意味著它在邏輯、模式發現、數學和其他典型生成式人工智慧模型難以處理的任務上表現良好。推理模型使用一種叫做「思考鏈」的方法。這讓人工智慧模型能夠將任務分解成幾個部分,並按照邏輯順序逐步解決,然後得出結論。

DeepSeek 的實際應用

你可以從 DeepSeek 的表現中看到這一點。當你問它是否可以為了保護某人的感受而撒謊時,模型首先用功利主義來處理這個問題,權衡即時的好處和潛在的未來傷害。然後,它考慮康德倫理學,這種倫理學主張你應該根據可以成為普遍法則的準則行事。它在分享結論之前會考慮這些和其他細微之處。(如果你感興趣,它發現撒謊在「善良和防止傷害至關重要的情況下通常是可以接受的,但沒有普遍的解決方案。」)



新聞來源

本文由 AI 台灣 運用 AI 技術編撰,內容僅供參考,請自行核實相關資訊。
歡迎加入我們的 AI TAIWAN 台灣人工智慧中心 FB 社團,
隨時掌握最新 AI 動態與實用資訊!

Tags: deepseek可能對能源來說並不是好消息
Previous Post

記憶與泛化:監督式微調 SFT 與強化學習 RL 如何塑造基礎模型學習

Next Post

好奇心驅動的強化學習來自人類反饋 CD-RLHF:一個減輕語言模型多樣性對齊權衡的 AI 框架

Related Posts

AI 助力中風患者康復Devon 的 SAMueL-2 計畫創新突破
AI 綜合新聞

AI 助力中風患者康復Devon 的 SAMueL-2 計畫創新突破

2025-04-24
2027 年 AI 預測人類水平 AI 的全新里程碑
AI 綜合新聞

2027 年 AI 預測人類水平 AI 的全新里程碑

2025-04-21
全球AI教育市場蓬勃發展智慧學習工具引領新趨勢
AI 綜合新聞

全球AI教育市場蓬勃發展智慧學習工具引領新趨勢

2025-04-21
AI 技術對人類智能的影響我們在失去什麼?
AI 綜合新聞

AI 技術對人類智能的影響我們在失去什麼?

2025-04-20
MIT 研發新技術提升 AI 生成代碼準確性助力非專業人士掌握 SQL 語言
AI 綜合新聞

MIT 研發新技術提升 AI 生成代碼準確性助力非專業人士掌握 SQL 語言

2025-04-18
人工智慧重塑遊戲開發遊戲未來從現在開始
AI 綜合新聞

人工智慧重塑遊戲開發遊戲未來從現在開始

2025-04-18
Next Post
好奇心驅動的強化學習來自人類反饋 CD-RLHF:一個減輕語言模型多樣性對齊權衡的 AI 框架

好奇心驅動的強化學習來自人類反饋 CD-RLHF:一個減輕語言模型多樣性對齊權衡的 AI 框架

什麼是檢索增強生成(RAG)

什麼是檢索增強生成(RAG)

發佈留言 取消回覆

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *

Archives

  • 2025 年 4 月
  • 2025 年 3 月
  • 2025 年 2 月
  • 2025 年 1 月
  • 2024 年 12 月
  • 2024 年 11 月
  • 2024 年 10 月
  • 2024 年 9 月
  • 2024 年 8 月
  • 2024 年 7 月
  • 2024 年 6 月
  • 2024 年 5 月
  • 2024 年 4 月
  • 2024 年 3 月
  • 2024 年 2 月
  • 2023 年 10 月
  • 2023 年 9 月
  • 2023 年 8 月
  • 2023 年 7 月
  • 2023 年 5 月
  • 2023 年 3 月
  • 2023 年 1 月
  • 2022 年 12 月
  • 2022 年 11 月
  • 2022 年 5 月
  • 2022 年 4 月
  • 2022 年 1 月
  • 2021 年 11 月
  • 2021 年 8 月
  • 2021 年 5 月
  • 2021 年 3 月
  • 2021 年 1 月
  • 2020 年 12 月
  • 2020 年 10 月
  • 2020 年 9 月
  • 2019 年 7 月
  • 2018 年 11 月

Categories

  • AI 智慧產業
  • AI 綜合新聞
  • AI 自動化與 AI Agents
  • 安全
  • 機器人與自動化
  • 機器學習與應用
  • 神經連結和腦機接口
  • 自然語言處理
  • 道德與法規
Your Ad
  • 關於我們
  • 廣告合作
  • 免責聲明
  • 隱私權政策
  • DMCA
  • Cookie 隱私權政策
  • 條款與條件
  • 聯絡我們
AI TAIWAN

版權 © 2024 AI TAIWAN.
AI TAIWAN 對外部網站的內容不負任何責任。

Welcome Back!

Login to your account below

Forgotten Password?

Retrieve your password

Please enter your username or email address to reset your password.

Log In
No Result
View All Result
  • Home
  • AI 綜合新聞
  • AI 自動化與 AI Agents
  • AI 智慧產業
  • 機器學習與應用
  • 自然語言處理
  • 神經連結和腦機接口
  • 機器人與自動化
  • 道德與法規
  • 安全

版權 © 2024 AI TAIWAN.
AI TAIWAN 對外部網站的內容不負任何責任。