這篇AI論文介紹了MaAS（多代理架構搜尋）：一個優化多代理系統的新機器學習框架

大型語言模型（LLMs）是多代理系統的基礎，讓多個人工智慧（AI）代理能夠合作、溝通和解決問題。這些代理使用LLMs來理解任務、生成回應和做出決策，模仿人類的團隊合作。然而，這類系統在執行時效率較低，因為它們基於固定的設計，無法針對所有任務進行調整，導致在處理簡單和複雜問題時消耗過多資源，浪費計算能力，並且反應速度慢。因此，在處理多樣化任務時，平衡準確性、速度和成本面臨重大挑戰。

目前，多代理系統依賴於現有的方法，如CAMEL、AutoGen、MetaGPT、DsPy、EvoPrompting、GPTSwarm和EvoAgent，這些方法專注於優化特定任務，如提示調整、代理設定和溝通。然而，這些方法在適應性方面存在困難。它們遵循預設的設計，無法針對多樣化任務進行調整，因此在處理複雜和簡單的查詢時效率不高。它們缺乏手動調整的靈活性，而自動化系統只能針對最佳配置進行搜尋，無法動態調整以提高效率。這使得這些方法在計算上成本高，並在應用於現實挑戰時表現較差。

為了解決現有多代理系統的限制，研究人員提出了MaAS（多代理架構搜尋）。這個框架使用概率性代理超網絡來生成依賴查詢的多代理架構。MaAS不是選擇固定的最佳系統，而是根據每個查詢動態抽樣自訂的多代理系統，平衡性能和計算成本。搜尋空間由代理操作符定義，這些操作符是基於LLM的工作流程，涉及多個代理、工具和提示。超網絡學習可能的代理架構的分佈，根據任務效用和成本限制進行優化。一個控制網絡根據查詢抽樣架構，使用混合專家（Mixture-of-Experts, MoE）風格的機制進行有效選擇。該框架通過成本感知的經驗貝葉斯蒙特卡羅進行優化，使用文本梯度方法更新代理操作符。這個框架提供自動化的多代理演化，使其在處理多樣化和複雜查詢時具備效率和適應性。

研究人員在六個公共基準上評估了MaAS，這些基準包括數學推理（GSM8K、MATH、MultiArith）、代碼生成（HumanEval、MBPP）和工具使用（GAIA），並與14個基準進行比較，包括單代理方法、手工製作的多代理系統和自動化方法。MaAS始終超越所有基準，在各任務中達到平均最佳得分83.59%，在GAIA Level 1任務上顯著提升了18.38%。成本分析顯示，MaAS在資源使用上效率高，所需的訓練標記最少，API成本最低，並且計算時間最短。案例研究突顯了其在動態優化多代理工作流程方面的適應性。

總結來說，這個方法修正了傳統多代理系統的問題，使用代理超網絡來適應不同的查詢。這使得系統運作更佳，資源使用更為明智，並變得更加靈活和可擴展。在未來的工作中，MaAS可能會發展成一個靈活且擴展的框架，以改善自動化和自我組織。未來的工作還可能在抽樣策略上進行優化，改善領域適應性，並納入現實世界的限制，以提升集體智慧。

新聞來源

本文由 AI 台灣 運用 AI 技術編撰，內容僅供參考，請自行核實相關資訊。
歡迎加入我們的 AI TAIWAN 台灣人工智慧中心 FB 社團，
隨時掌握最新 AI 動態與實用資訊！

Tags: 這篇AI論文介紹了MaAS多代理架構搜尋一個優化多代理系統的新機器學習框架