星期日, 15 6 月, 2025
No Result
View All Result
AI TAIWAN 台灣人工智慧中心
  • Home
  • AI 綜合新聞
  • AI 自動化與 AI Agents
  • AI 智慧產業
  • 機器學習與應用
  • 自然語言處理
  • 神經連結和腦機接口
  • 機器人與自動化
  • 道德與法規
  • 安全
AI TAIWAN 台灣人工智慧中心
  • Home
  • AI 綜合新聞
  • AI 自動化與 AI Agents
  • AI 智慧產業
  • 機器學習與應用
  • 自然語言處理
  • 神經連結和腦機接口
  • 機器人與自動化
  • 道德與法規
  • 安全
No Result
View All Result
AI TAIWAN 台灣人工智慧中心
No Result
View All Result
Your Ad
Home AI 綜合新聞

Google AI 推出 PlanGEN:一個多代理 AI 框架,旨在通過約束引導的迭代驗證和自適應算法選擇來增強 LLM 的規劃和推理能力

2025-03-01
in AI 綜合新聞
0 0
0
Google AI 推出 PlanGEN:一個多代理 AI 框架,旨在通過約束引導的迭代驗證和自適應算法選擇來增強 LLM 的規劃和推理能力
Share on FacebookShare on Twitter
Your Ad


大型語言模型在自然語言處理方面取得了顯著的進展,但在處理複雜的計劃和推理任務時仍然面臨挑戰。傳統的方法通常依賴靜態模板或單一代理系統,這些方法無法捕捉現實問題的細微差別。當模型需要驗證生成的計劃、適應不同的複雜程度或反覆改進輸出時,這種不足尤為明顯。無論是安排會議還是解決科學問題,傳統方法的限制促使我們需要更細緻和靈活的策略。

谷歌人工智慧(Google AI)推出了PlanGEN——一個多代理框架,旨在通過引入約束指導的迭代驗證和自適應算法選擇來改善大型語言模型的計劃和推理。PlanGEN由三個代理協同工作:約束代理提取問題特定的細節,驗證代理評估提議計劃的質量,而選擇代理根據問題的複雜性選擇最合適的推理算法。這個框架不再依賴單一的僵化方法,而是促進了一個過程,讓初步計劃能夠反覆改進,確保最終輸出既準確又符合上下文。

技術基礎與優勢

PlanGEN的核心在於其模組化和精煉的設計。這個過程始於約束代理,它仔細提取問題描述中的關鍵參數,例如日曆計劃中的個別日程或科學推理任務中的關鍵概念。這些提取的信息形成了一組標準,用來衡量潛在計劃的質量。然後,驗證代理進行評估,根據這些約束對每個候選計劃進行打分,分數範圍從-100到100。這種以自然語言表達的反饋不僅量化了計劃的質量,還突出了改進的空間。

選擇代理則通過使用修改過的上置信界(Upper Confidence Bound, UCB)策略,為系統增添了另一層複雜性。這種自適應機制考慮了歷史表現、探索未經測試的方法的需求以及從先前錯誤中恢復的能力。通過在不同的推理算法之間動態選擇,例如最佳N(Best of N)、思維樹(Tree-of-Thought, ToT)或REBASE,PlanGEN能夠根據每個特定任務的複雜性調整其方法。該框架的設計使其能夠在不同策略之間平滑過渡,平衡探索與利用,而不會過度依賴任何一種方法。

實證見解與實驗結果

PlanGEN在多個基準測試中進行了評估,顯示出在計劃和推理任務中的一致性改進。在NATURAL PLAN基準測試中,涵蓋了日曆安排、會議計劃和旅行計劃等任務,PlanGEN在精確匹配分數上顯示了顯著的改善。例如,該框架的一個變體在日曆安排中表現更佳,通過有效地反覆驗證計劃步驟來提升計劃質量。

同樣,在數學和科學推理基準測試如奧林匹克基準(OlympiadBench)中,該框架的自適應方法在數學和物理類別中提高了準確性。在專注於金融文件理解的DocFinQA數據集中,PlanGEN能夠提升準確性和F1分數。這些改進歸因於該框架能夠利用詳細的反饋並相應調整其推理策略。通過整合驗證和選擇機制,PlanGEN展示了一種平衡且有條理的問題解決方法,能夠適應每個任務的需求。

結論

PlanGEN代表了在解決大型語言模型中複雜計劃和推理挑戰方面的一次深思熟慮的進步。通過結合多個專門代理的優勢,該框架支持一種更有意識和迭代的高質量計劃生成方法。其模組化設計——以提取約束、迭代驗證和自適應選擇推理算法為中心——確保每個解決方案都經過精心改進,以滿足特定任務的要求。

來自各種基準的結果表明,協作的多代理系統確實能夠超越更傳統的單代理方法,而不依賴過於激進的主張。相反,觀察到的改進是系統性地整合反饋和適應實例級複雜性所取得的可衡量的漸進式進展。隨著該領域的持續發展,PlanGEN的平衡方法為未來在增強大型語言模型的自然語言計劃能力方面提供了有希望的基礎。這種基於仔細分析和迭代改進的方法,為複雜推理任務的更強大和可靠的人工智慧系統提供了一條實際的途徑。

查看論文。所有對這項研究的讚譽都歸功於該項目的研究人員。此外,歡迎您在Twitter上關注我們,並別忘了加入我們的80k+機器學習SubReddit。

🚨 推薦閱讀 – LG AI Research發布NEXUS:一個先進的系統,整合代理人工智慧系統和數據合規標準,以解決人工智慧數據集中的法律問題。



新聞來源

本文由 AI 台灣 運用 AI 技術編撰,內容僅供參考,請自行核實相關資訊。
歡迎加入我們的 AI TAIWAN 台灣人工智慧中心 FB 社團,
隨時掌握最新 AI 動態與實用資訊!

Tags: googlellmPlanGEN一個多代理推出框架旨在通過約束引導的迭代驗證和自適應算法選擇來增強的規劃和推理能力
Previous Post

2025 ISO 和 CSA STAR 證書現已推出,新增四項服務

Next Post

人性化的AI Pin已經復活

Related Posts

中國教育改革人工智慧助力創新人才培育
AI 綜合新聞

中國教育改革人工智慧助力創新人才培育

2025-06-11
AI 助力中風患者康復Devon 的 SAMueL-2 計畫創新突破
AI 綜合新聞

AI 助力中風患者康復Devon 的 SAMueL-2 計畫創新突破

2025-04-24
2027 年 AI 預測人類水平 AI 的全新里程碑
AI 綜合新聞

2027 年 AI 預測人類水平 AI 的全新里程碑

2025-04-21
全球AI教育市場蓬勃發展智慧學習工具引領新趨勢
AI 綜合新聞

全球AI教育市場蓬勃發展智慧學習工具引領新趨勢

2025-04-21
AI 技術對人類智能的影響我們在失去什麼?
AI 綜合新聞

AI 技術對人類智能的影響我們在失去什麼?

2025-04-20
MIT 研發新技術提升 AI 生成代碼準確性助力非專業人士掌握 SQL 語言
AI 綜合新聞

MIT 研發新技術提升 AI 生成代碼準確性助力非專業人士掌握 SQL 語言

2025-04-18
Next Post
人性化的AI Pin已經復活

人性化的AI Pin已經復活

這篇AI論文介紹了代理獎勵建模(ARM)和REWARDAGENT:一種結合人類偏好和可驗證正確性的混合AI方法,用於可靠的LLM訓練

這篇AI論文介紹了代理獎勵建模(ARM)和REWARDAGENT:一種結合人類偏好和可驗證正確性的混合AI方法,用於可靠的LLM訓練

發佈留言 取消回覆

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *

Archives

  • 2025 年 6 月
  • 2025 年 4 月
  • 2025 年 3 月
  • 2025 年 2 月
  • 2025 年 1 月
  • 2024 年 12 月
  • 2024 年 11 月
  • 2024 年 10 月
  • 2024 年 9 月
  • 2024 年 8 月
  • 2024 年 7 月
  • 2024 年 6 月
  • 2024 年 5 月
  • 2024 年 4 月
  • 2024 年 3 月
  • 2024 年 2 月
  • 2023 年 10 月
  • 2023 年 9 月
  • 2023 年 8 月
  • 2023 年 7 月
  • 2023 年 5 月
  • 2023 年 3 月
  • 2023 年 1 月
  • 2022 年 12 月
  • 2022 年 11 月
  • 2022 年 5 月
  • 2022 年 4 月
  • 2022 年 1 月
  • 2021 年 11 月
  • 2021 年 8 月
  • 2021 年 5 月
  • 2021 年 3 月
  • 2021 年 1 月
  • 2020 年 12 月
  • 2020 年 10 月
  • 2020 年 9 月
  • 2019 年 7 月
  • 2018 年 11 月

Categories

  • AI 智慧產業
  • AI 綜合新聞
  • AI 自動化與 AI Agents
  • 安全
  • 機器人與自動化
  • 機器學習與應用
  • 神經連結和腦機接口
  • 自然語言處理
  • 道德與法規
Your Ad
  • 關於我們
  • 廣告合作
  • 免責聲明
  • 隱私權政策
  • DMCA
  • Cookie 隱私權政策
  • 條款與條件
  • 聯絡我們
AI TAIWAN

版權 © 2024 AI TAIWAN.
AI TAIWAN 對外部網站的內容不負任何責任。

Welcome Back!

Login to your account below

Forgotten Password?

Retrieve your password

Please enter your username or email address to reset your password.

Log In
No Result
View All Result
  • Home
  • AI 綜合新聞
  • AI 自動化與 AI Agents
  • AI 智慧產業
  • 機器學習與應用
  • 自然語言處理
  • 神經連結和腦機接口
  • 機器人與自動化
  • 道德與法規
  • 安全

版權 © 2024 AI TAIWAN.
AI TAIWAN 對外部網站的內容不負任何責任。