星期六, 24 5 月, 2025
No Result
View All Result
AI TAIWAN 台灣人工智慧中心
  • Home
  • AI 綜合新聞
  • AI 自動化與 AI Agents
  • AI 智慧產業
  • 機器學習與應用
  • 自然語言處理
  • 神經連結和腦機接口
  • 機器人與自動化
  • 道德與法規
  • 安全
AI TAIWAN 台灣人工智慧中心
  • Home
  • AI 綜合新聞
  • AI 自動化與 AI Agents
  • AI 智慧產業
  • 機器學習與應用
  • 自然語言處理
  • 神經連結和腦機接口
  • 機器人與自動化
  • 道德與法規
  • 安全
No Result
View All Result
AI TAIWAN 台灣人工智慧中心
No Result
View All Result
Your Ad
Home 自然語言處理

兩分鐘生成式人工智慧 — Marco-o1,一個新的大型推理模型 (LRM) | Fabio Chiusano | 生成式人工智慧 | 2024年11月

2024-11-22
in 自然語言處理
0 0
0
兩分鐘生成式人工智慧 — Marco-o1,一個新的大型推理模型 (LRM) | Fabio Chiusano | 生成式人工智慧 | 2024年11月
Share on FacebookShare on Twitter
Your Ad


了解術語:大型推理模型 (Large Reasoning Model, LRM)。你將很快聽到很多次。

OpenAI 的 o1 模型引起了人們對大型推理模型 (LRMs) 的重大關注。基於這股熱潮,Marco-o1 是一個新的 LRM,專注於數學和編程等標準學科,並強調在更廣泛的領域中開放式的解決方案。

特別是,Marco-o1 探討 o1 模型是否能夠推廣到缺乏明確標準和可量化獎勵的領域。

Marco-o1 是一個基於過濾的 Open-O1 CoT 數據集、Marco-o1 CoT 數據集和 Marco-o1 Instruction 數據集的 “Qwen2–7B-Instruct” 微調版本,目的是改善處理複雜任務的能力。

為了進一步增強推理能力,Marco-o1 使用了蒙地卡羅樹搜索 (Monte Carlo Tree Search, MCTS) 和其他創新的推理策略。特別是,MCTS 使用來自 top-𝑘 令牌的日誌概率的信心分數來探索多條推理路徑,引導模型找到更好的解決方案。

Marco-o1 在 MGSM (Multilingual Grade School Math) 英文上提高了 +6.17% 的準確率,在 MGSM 中文上提高了 +5.60% 的準確率。

這篇論文的貢獻包括:

  • 使用 CoT 數據進行微調:作者通過使用開源 CoT 數據集和新的合成數據對基礎模型進行全參數微調,開發了 Marco-o1-CoT。
  • 通過 MCTS 擴展解決方案空間:作者將 LLM 與 MCTS (Marco-o1-MCTS) 整合,利用模型的輸出信心來指導搜索並擴展解決方案空間。
  • 新的推理行動策略:作者實現了新穎的推理行動策略和反思機制 (Marco-o1-MCTS mini-step),在 MCTS 框架內探索不同的行動粒度,並促使模型進行自我反思。

謝謝你的閱讀!如果你想了解更多關於生成式人工智慧的資訊,記得在 LinkedIn 上關注生成式人工智慧中心。



新聞來源

本文由 AI 台灣 運用 AI 技術編撰,內容僅供參考,請自行核實相關資訊。
歡迎加入我們的 AI TAIWAN 台灣人工智慧中心 FB 社團,
隨時掌握最新 AI 動態與實用資訊!

Tags: 2024年11月ChiusanoFabioLRMMarcoo1一個新的大型推理模型兩分鐘生成式人工智慧生成式人工智慧
Previous Post

什麼是離散化? – Analytics Vidhya

Next Post

大型科技公司的人工智慧支出達到新高峰

Related Posts

OpenAI 正在開發代理人 — 每週 AI 通訊 (2025 年 3 月 17 日)
自然語言處理

OpenAI 正在開發代理人 — 每週 AI 通訊 (2025 年 3 月 17 日)

2025-03-17
什麼是自然語言語義學?
自然語言處理

什麼是自然語言語義學?

2025-03-13
阿拉伯方言的詞彙距離研究:全面概述
自然語言處理

阿拉伯方言的詞彙距離研究:全面概述

2025-03-12
阿里巴巴發布 QwQ-32B 並附上理由 — 每週 AI 通訊 (2025 年 3 月 10 日)
自然語言處理

阿里巴巴發布 QwQ-32B 並附上理由 — 每週 AI 通訊 (2025 年 3 月 10 日)

2025-03-10
GPT 4.5 發佈! — 每週 AI 通訊 (2025 年 3 月 3 日)
自然語言處理

GPT 4.5 發佈! — 每週 AI 通訊 (2025 年 3 月 3 日)

2025-03-03
自然語言處理的主要關鍵領域
自然語言處理

自然語言處理的主要關鍵領域

2025-03-03
Next Post
大型科技公司的人工智慧支出達到新高峰

大型科技公司的人工智慧支出達到新高峰

俄羅斯間諜透過Wi-Fi在史無前例的黑客攻擊中從一個網絡跳轉到另一個網絡

俄羅斯間諜透過Wi-Fi在史無前例的黑客攻擊中從一個網絡跳轉到另一個網絡

發佈留言 取消回覆

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *

Archives

  • 2025 年 4 月
  • 2025 年 3 月
  • 2025 年 2 月
  • 2025 年 1 月
  • 2024 年 12 月
  • 2024 年 11 月
  • 2024 年 10 月
  • 2024 年 9 月
  • 2024 年 8 月
  • 2024 年 7 月
  • 2024 年 6 月
  • 2024 年 5 月
  • 2024 年 4 月
  • 2024 年 3 月
  • 2024 年 2 月
  • 2023 年 10 月
  • 2023 年 9 月
  • 2023 年 8 月
  • 2023 年 7 月
  • 2023 年 5 月
  • 2023 年 3 月
  • 2023 年 1 月
  • 2022 年 12 月
  • 2022 年 11 月
  • 2022 年 5 月
  • 2022 年 4 月
  • 2022 年 1 月
  • 2021 年 11 月
  • 2021 年 8 月
  • 2021 年 5 月
  • 2021 年 3 月
  • 2021 年 1 月
  • 2020 年 12 月
  • 2020 年 10 月
  • 2020 年 9 月
  • 2019 年 7 月
  • 2018 年 11 月

Categories

  • AI 智慧產業
  • AI 綜合新聞
  • AI 自動化與 AI Agents
  • 安全
  • 機器人與自動化
  • 機器學習與應用
  • 神經連結和腦機接口
  • 自然語言處理
  • 道德與法規
Your Ad
  • 關於我們
  • 廣告合作
  • 免責聲明
  • 隱私權政策
  • DMCA
  • Cookie 隱私權政策
  • 條款與條件
  • 聯絡我們
AI TAIWAN

版權 © 2024 AI TAIWAN.
AI TAIWAN 對外部網站的內容不負任何責任。

Welcome Back!

Login to your account below

Forgotten Password?

Retrieve your password

Please enter your username or email address to reset your password.

Log In
No Result
View All Result
  • Home
  • AI 綜合新聞
  • AI 自動化與 AI Agents
  • AI 智慧產業
  • 機器學習與應用
  • 自然語言處理
  • 神經連結和腦機接口
  • 機器人與自動化
  • 道德與法規
  • 安全

版權 © 2024 AI TAIWAN.
AI TAIWAN 對外部網站的內容不負任何責任。