星期日, 15 6 月, 2025
No Result
View All Result
AI TAIWAN 台灣人工智慧中心
  • Home
  • AI 綜合新聞
  • AI 自動化與 AI Agents
  • AI 智慧產業
  • 機器學習與應用
  • 自然語言處理
  • 神經連結和腦機接口
  • 機器人與自動化
  • 道德與法規
  • 安全
AI TAIWAN 台灣人工智慧中心
  • Home
  • AI 綜合新聞
  • AI 自動化與 AI Agents
  • AI 智慧產業
  • 機器學習與應用
  • 自然語言處理
  • 神經連結和腦機接口
  • 機器人與自動化
  • 道德與法規
  • 安全
No Result
View All Result
AI TAIWAN 台灣人工智慧中心
No Result
View All Result
Your Ad
Home AI 綜合新聞

超越蒙地卡羅樹搜尋:釋放離散擴散中的隱性棋藝策略

2025-03-05
in AI 綜合新聞
0 0
0
超越蒙地卡羅樹搜尋:釋放離散擴散中的隱性棋藝策略
Share on FacebookShare on Twitter
Your Ad



大型語言模型(LLMs)逐步生成文本,這限制了它們在需要多步推理的任務中進行規劃的能力,例如結構化寫作或解決問題。這種缺乏長期規劃的情況影響了它們在複雜情境中的連貫性和決策能力。有些方法在做出選擇之前會評估不同的選項,這樣可以提高預測的準確性。然而,這些方法的計算成本較高,並且如果未來的預測不正確,則容易出錯。

像蒙特卡羅樹搜索(Monte Carlo Tree Search, MCTS)和束搜索(beam search)這樣的顯式搜索算法在人工智慧的規劃和決策中受到喜愛,但它們也有固有的限制。這些算法使用重複的未來模擬,隨著計算成本的上升,變得不適合即時系統。它們還依賴於一個價值模型來估計每個狀態,如果這個模型不正確,錯誤會在搜索過程中傳播。由於長期預測會產生更多錯誤,這些錯誤會累積並降低決策的準確性。在需要長期規劃的複雜任務中,這尤其成為一個問題,因為保持準確的預見變得困難,導致結果不佳。

為了解決這些問題,香港大學(The University of Hong Kong)、上海交通大學(Shanghai Jiaotong University)、華為諾亞方舟實驗室(Huawei Noah’s Ark Lab)和上海人工智慧實驗室(Shanghai AI Laboratory)的研究人員提出了DIFFUSEARCH。這是一個基於離散擴散的框架,消除了像MCTS這樣的顯式搜索算法。DIFFUSEARCH不依賴於昂貴的搜索過程,而是訓練政策來直接預測和利用未來的表示,並使用擴散模型迭代地改進預測。將世界模型和政策整合到一個框架中,減少了計算開銷,同時提高了長期規劃的效率和準確性。

這個框架使用監督學習來訓練模型,利用Stockfish作為神諭來標記棋局的狀態。研究人員檢查了不同的未來表示,選擇了行動狀態(s-asa)方法,因為它簡單且高效。模型不是直接預測未來的序列,而是利用離散擴散建模,應用自注意力和迭代去噪來逐步改進行動預測。DIFFUSEARCH在推理過程中通過直接從訓練好的模型中抽樣,避免了對未來狀態的昂貴邊際化。簡單優先的解碼策略優先考慮更可預測的標記進行去噪,從而提高準確性。

研究人員將DIFFUSEARCH與三個基於變壓器的基準模型進行了評估:狀態-行動(State-Action, S-A)、狀態-價值(State-Value, S-V)和行動-價值(Action-Value, SA-V)模型,這些模型分別使用行為克隆、基於價值的決策和合法行動比較進行訓練。使用10萬局棋賽的數據集,狀態以FEN格式編碼,行動以UCI標記,實現了基於GPT-2的模型,使用Adam優化器,學習率為3e-4,批次大小為1024,8層架構(700萬參數),預測範圍為4,擴散時間步設置為20。評估包括行動準確性、謎題準確性和來自6000局內部比賽的Elo評分。DIFFUSEARCH在行動準確性上超越了S-A 653 Elo和19%,並且儘管使用的數據記錄少了20倍,仍然超過了SA-V。離散擴散與線性λt達到了最高準確性(41.31%),超過了自回歸和高斯方法。DIFFUSEARCH在未來行動的預測能力上保持了優勢,儘管準確性隨著步驟的增加而下降,且隨著更多的注意層和精細解碼,性能有所提升。作為一種隱式搜索方法,它在與基於顯式MCTS的方法競爭中顯示出競爭力。

總結來說,這個提出的模型證明了通過離散擴散的隱式搜索可以有效地取代顯式搜索並改善棋類決策。該模型超越了無搜索和顯式策略,顯示出學習未來模仿策略的潛力。儘管使用了外部神諭和有限的數據集,該模型顯示了通過自我對弈和長期上下文建模改進的未來可能性。更一般地說,這種方法可以應用於改善語言模型中的下一個標記預測。作為進一步研究的起點,它為探索人工智慧的規劃和決策中的隱式搜索奠定了基礎。

查看論文和GitHub頁面。所有這項研究的功勞都歸於這個項目的研究人員。此外,隨時在Twitter上關注我們,別忘了加入我們的80k+機器學習SubReddit。

🚨 推薦閱讀 – LG AI Research發布NEXUS:一個先進的系統,整合代理AI系統和數據合規標準,以解決AI數據集中的法律問題。



新聞來源

本文由 AI 台灣 運用 AI 技術編撰,內容僅供參考,請自行核實相關資訊。
歡迎加入我們的 AI TAIWAN 台灣人工智慧中心 FB 社團,
隨時掌握最新 AI 動態與實用資訊!

Tags: 超越蒙地卡羅樹搜尋釋放離散擴散中的隱性棋藝策略
Previous Post

未來之家與科學機器的研究人員推出BixBench:一個旨在評估AI代理在現實世界生物資訊學任務上的基準測試

Next Post

資料品質:確保您可以信賴的數據

Related Posts

中國教育改革人工智慧助力創新人才培育
AI 綜合新聞

中國教育改革人工智慧助力創新人才培育

2025-06-11
AI 助力中風患者康復Devon 的 SAMueL-2 計畫創新突破
AI 綜合新聞

AI 助力中風患者康復Devon 的 SAMueL-2 計畫創新突破

2025-04-24
全球AI教育市場蓬勃發展智慧學習工具引領新趨勢
AI 綜合新聞

全球AI教育市場蓬勃發展智慧學習工具引領新趨勢

2025-04-21
2027 年 AI 預測人類水平 AI 的全新里程碑
AI 綜合新聞

2027 年 AI 預測人類水平 AI 的全新里程碑

2025-04-21
AI 技術對人類智能的影響我們在失去什麼?
AI 綜合新聞

AI 技術對人類智能的影響我們在失去什麼?

2025-04-20
人工智慧重塑遊戲開發遊戲未來從現在開始
AI 綜合新聞

人工智慧重塑遊戲開發遊戲未來從現在開始

2025-04-18
Next Post
資料品質:確保您可以信賴的數據

資料品質:確保您可以信賴的數據

AI推理模型可以作弊贏得棋賽

AI推理模型可以作弊贏得棋賽

發佈留言 取消回覆

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *

Archives

  • 2025 年 6 月
  • 2025 年 4 月
  • 2025 年 3 月
  • 2025 年 2 月
  • 2025 年 1 月
  • 2024 年 12 月
  • 2024 年 11 月
  • 2024 年 10 月
  • 2024 年 9 月
  • 2024 年 8 月
  • 2024 年 7 月
  • 2024 年 6 月
  • 2024 年 5 月
  • 2024 年 4 月
  • 2024 年 3 月
  • 2024 年 2 月
  • 2023 年 10 月
  • 2023 年 9 月
  • 2023 年 8 月
  • 2023 年 7 月
  • 2023 年 5 月
  • 2023 年 3 月
  • 2023 年 1 月
  • 2022 年 12 月
  • 2022 年 11 月
  • 2022 年 5 月
  • 2022 年 4 月
  • 2022 年 1 月
  • 2021 年 11 月
  • 2021 年 8 月
  • 2021 年 5 月
  • 2021 年 3 月
  • 2021 年 1 月
  • 2020 年 12 月
  • 2020 年 10 月
  • 2020 年 9 月
  • 2019 年 7 月
  • 2018 年 11 月

Categories

  • AI 智慧產業
  • AI 綜合新聞
  • AI 自動化與 AI Agents
  • 安全
  • 機器人與自動化
  • 機器學習與應用
  • 神經連結和腦機接口
  • 自然語言處理
  • 道德與法規
Your Ad
  • 關於我們
  • 廣告合作
  • 免責聲明
  • 隱私權政策
  • DMCA
  • Cookie 隱私權政策
  • 條款與條件
  • 聯絡我們
AI TAIWAN

版權 © 2024 AI TAIWAN.
AI TAIWAN 對外部網站的內容不負任何責任。

Welcome Back!

Login to your account below

Forgotten Password?

Retrieve your password

Please enter your username or email address to reset your password.

Log In
No Result
View All Result
  • Home
  • AI 綜合新聞
  • AI 自動化與 AI Agents
  • AI 智慧產業
  • 機器學習與應用
  • 自然語言處理
  • 神經連結和腦機接口
  • 機器人與自動化
  • 道德與法規
  • 安全

版權 © 2024 AI TAIWAN.
AI TAIWAN 對外部網站的內容不負任何責任。