自主型人工智慧(Agentic AI)系統正在改變許多產業,因為它們能夠透過專門的代理人合作來完成複雜的工作流程。這些系統可以簡化操作、自動化決策,並提高各個領域的整體效率,包括市場研究、醫療保健和企業管理。然而,這些系統的優化仍然是一個持續的挑戰,因為傳統方法過於依賴人工調整,這限制了它們的擴展性和適應性。
優化自主型人工智慧系統的一個關鍵挑戰是它們對人工配置的依賴,這會引入低效率和不一致性。這些系統必須不斷演變,以適應動態目標並解決代理人之間的複雜互動。目前的做法往往無法提供自動改進的機制,導致性能和擴展性受到阻礙。因此,需要強大的框架來進行不需要人類干預的迭代改進。
現有的優化自主型人工智慧系統的工具主要集中在評估性能基準或模組化設計上。雖然像 MLA-gentBench 這樣的框架可以評估代理人在各項任務中的表現,但它們並沒有解決持續、端到端優化的更廣泛需求。同樣,模組化方法增強了單個組件,但缺乏動態產業所需的整體適應性。這些限制凸顯了需要能夠通過迭代反饋和改進來自動提升工作流程的系統。
研究公司 aiXplain Inc. 提出了一個新框架,利用大型語言模型(LLMs),特別是 Llama 3.2-3B,來自動優化自主型人工智慧系統。這個框架整合了專門的代理人來進行評估、假設生成、修改和執行。它使用迭代反饋循環來確保持續改進,顯著減少對人類監督的依賴。這個系統旨在廣泛應用於各行各業,解決特定領域的挑戰,同時保持適應性和擴展性。
這個框架通過一個結構化的合成和評估過程運作。最初部署一個基準的自主型人工智慧配置,並將特定任務和工作流程分配給代理人。評估指標包括質性(清晰度、相關性)和量化(執行時間、成功率),這些指標指導改進過程。專門的代理人,如假設代理人和修改代理人,會不斷提出和實施變更,以提高性能。系統會持續優化配置,直到達到預定目標或性能改進趨於平穩。
這個框架的變革潛力通過幾個不同領域的案例研究得到了證明。每個案例都突顯了原始系統面臨的挑戰、引入的修改以及性能指標的改善:
市場研究代理人:最初的系統在市場分析深度和用戶需求對應上表現不佳,清晰度和相關性得分僅為 0.6。改進後引入了市場研究分析師和數據分析師等專門代理人,增強了數據驅動的決策能力,並優先考慮以用戶為中心的設計。經過改進後,系統在對應和相關性上的得分提高到 0.9,顯著改善了提供可行見解的能力。
醫療影像架構代理人:這個系統在法規遵循、病人參與和解釋性方面面臨挑戰。增加了法規遵循專家和病人倡導者等專門代理人,並引入了透明度框架以改善解釋性。經過改進後,系統在法規遵循上得分 0.9,在以病人為中心的設計上得分 0.8,有效應對了醫療保健的關鍵需求。
職業轉換代理人:這個系統最初設計用來幫助軟體工程師轉型到人工智慧角色,但在清晰度和與行業標準的對應上表現不佳。通過引入領域專家和技能開發者等代理人,改進後的系統提供了詳細的時間表和結構化的輸出,將溝通清晰度得分從 0.6 提高到 0.9。這改善了系統促進有效職業轉換的能力。
供應鏈外展代理人:最初範圍有限的供應鏈管理外展代理人系統在處理操作複雜性方面遇到困難。引入了五個專門角色,以增強對供應鏈分析、優化和可持續性的關注。這些修改顯著提高了清晰度、準確性和可行性,將系統定位為電子商務公司的有價值工具。
LinkedIn 內容代理人:這個系統最初設計用來生成關於生成式人工智慧趨勢的 LinkedIn 貼文,但在參與度和可信度上表現不佳。引入了觀眾參與專家等專門角色,強調指標和適應性。經過改進後,系統在觀眾互動和相關性上都有顯著改善,增強了其作為內容創建工具的實用性。
會議促進代理人:這個系統是為了人工智慧驅動的藥物發現而開發的,但在與行業趨勢和分析深度的對應上表現不佳。通過整合人工智慧行業專家和法規遵循負責人等角色,改進後的系統在所有評估類別中均達到 0.9 或更高的得分,使其對製藥利益相關者更具相關性和可行性。
潛在客戶生成代理人:這個系統專注於「個性化學習的人工智慧」平台,最初在數據準確性和商業對應上表現不佳。引入了市場分析師和商業發展專家等專門代理人,改善了潛在客戶的資格審查過程。經過改進後,系統在商業目標對應上得分 0.91,在數據準確性上得分 0.90,突顯了針對性修改的影響。
在這些案例中,迭代反饋循環機制被證明對提高清晰度、相關性和可行性至關重要。例如,市場研究和醫療影像系統在改進後的性能指標提高了超過 30%。輸出的變異性顯著降低,確保了穩定和可靠的性能。
這項研究提供了幾個關鍵要點:
- 這個框架能有效擴展到各種產業,保持適應性而不妨礙特定領域的需求。
- 執行時間、清晰度和相關性等關鍵指標在案例研究中平均提高了 30%。
- 引入特定領域的角色有效解決了獨特挑戰,如市場研究和醫療影像案例所示。
- 迭代反饋循環機制最小化了人類干預,提高了操作效率並減少了改進周期。
- 輸出的變異性顯著降低,確保了在動態環境中的可靠性能。
- 增強的輸出與用戶需求和行業目標對應,提供了跨領域的可行見解。
總結來說,aiXplain Inc. 的創新框架通過解決傳統手動改進過程的限制來優化自主型人工智慧系統。這個框架通過整合大型語言模型驅動的代理人和迭代反饋循環,實現了在各個領域的持續自動改進。案例研究展示了其可擴展性、適應性以及在清晰度、相關性和可行性等性能指標上的一致提升,許多情況下得分超過 0.9。這種方法減少了變異性,並使輸出與行業特定需求相對應。
查看論文。所有研究的功勞都歸於這個項目的研究人員。此外,別忘了在 Twitter 上關注我們,加入我們的 Telegram 頻道和 LinkedIn 群組。別忘了加入我們的 60k+ 機器學習 SubReddit。
🚨 熱門消息:LG 人工智慧研究發布 EXAONE 3.5:三個開源雙語前沿人工智慧級模型,提供無與倫比的指令跟隨和長上下文理解,為生成式人工智慧卓越領導力提供支持……。
本文由 AI 台灣 運用 AI 技術編撰,內容僅供參考,請自行核實相關資訊。
歡迎加入我們的 AI TAIWAN 台灣人工智慧中心 FB 社團,
隨時掌握最新 AI 動態與實用資訊!