大型語言模型(LLMs)是多代理系統的基礎,讓多個人工智慧(AI)代理能夠合作、溝通和解決問題。這些代理使用LLMs來理解任務、生成回應和做出決策,模仿人類的團隊合作。然而,這類系統在執行時效率較低,因為它們基於固定的設計,無法針對所有任務進行調整,導致在處理簡單和複雜問題時消耗過多資源,浪費計算能力,並且反應速度慢。因此,在處理多樣化任務時,平衡準確性、速度和成本面臨重大挑戰。
目前,多代理系統依賴於現有的方法,如CAMEL、AutoGen、MetaGPT、DsPy、EvoPrompting、GPTSwarm和EvoAgent,這些方法專注於優化特定任務,如提示調整、代理設定和溝通。然而,這些方法在適應性方面存在困難。它們遵循預設的設計,無法針對多樣化任務進行調整,因此在處理複雜和簡單的查詢時效率不高。它們缺乏手動調整的靈活性,而自動化系統只能針對最佳配置進行搜尋,無法動態調整以提高效率。這使得這些方法在計算上成本高,並在應用於現實挑戰時表現較差。
為了解決現有多代理系統的限制,研究人員提出了MaAS(多代理架構搜尋)。這個框架使用概率性代理超網絡來生成依賴查詢的多代理架構。MaAS不是選擇固定的最佳系統,而是根據每個查詢動態抽樣自訂的多代理系統,平衡性能和計算成本。搜尋空間由代理操作符定義,這些操作符是基於LLM的工作流程,涉及多個代理、工具和提示。超網絡學習可能的代理架構的分佈,根據任務效用和成本限制進行優化。一個控制網絡根據查詢抽樣架構,使用混合專家(Mixture-of-Experts, MoE)風格的機制進行有效選擇。該框架通過成本感知的經驗貝葉斯蒙特卡羅進行優化,使用文本梯度方法更新代理操作符。這個框架提供自動化的多代理演化,使其在處理多樣化和複雜查詢時具備效率和適應性。
研究人員在六個公共基準上評估了MaAS,這些基準包括數學推理(GSM8K、MATH、MultiArith)、代碼生成(HumanEval、MBPP)和工具使用(GAIA),並與14個基準進行比較,包括單代理方法、手工製作的多代理系統和自動化方法。MaAS始終超越所有基準,在各任務中達到平均最佳得分83.59%,在GAIA Level 1任務上顯著提升了18.38%。成本分析顯示,MaAS在資源使用上效率高,所需的訓練標記最少,API成本最低,並且計算時間最短。案例研究突顯了其在動態優化多代理工作流程方面的適應性。
總結來說,這個方法修正了傳統多代理系統的問題,使用代理超網絡來適應不同的查詢。這使得系統運作更佳,資源使用更為明智,並變得更加靈活和可擴展。在未來的工作中,MaAS可能會發展成一個靈活且擴展的框架,以改善自動化和自我組織。未來的工作還可能在抽樣策略上進行優化,改善領域適應性,並納入現實世界的限制,以提升集體智慧。
新聞來源
本文由 AI 台灣 運用 AI 技術編撰,內容僅供參考,請自行核實相關資訊。
歡迎加入我們的 AI TAIWAN 台灣人工智慧中心 FB 社團,
隨時掌握最新 AI 動態與實用資訊!