OpenAI 最近推出了一個名為 Operator 的工具,它能夠與網頁瀏覽器無縫整合,自動執行任務。從填寫表單到訂購雜貨,Operator 承諾通過直接與網站進行點擊、輸入和滾動來簡化重複的線上活動。
Operator 的設計基於一個新的模型,叫做計算機使用代理 (Computer-Using Agent, CUA),它結合了 GPT-4o 的視覺識別和先進的推理能力,讓它能夠作為一個虛擬的「瀏覽器中的人類」。然而,儘管這項創新受到關注,業界專家認為仍有改進的空間。
專門顧問公司 Lab49 的人工智慧、數據和分析部門負責人 Yiannis Antoniou 分享了他對 Operator 在代理人工智慧系統競爭中的重要性和定位的看法。
透過熟悉的介面實現代理人工智慧
Antoniou 表示:「OpenAI 宣布推出 Operator,這是其進軍代理人工智慧領域的最新嘗試,既令人著迷又不夠完整。」他在金融服務公司設計人工智慧系統方面擁有超過二十年的經驗。
「顯然受到了 Anthropic Claude 的計算機使用系統的影響,該系統在十月首次推出,Operator 簡化了用戶體驗,消除了對複雜基礎設施的需求,專注於一個大家熟悉的介面:瀏覽器。」
通過設計 Operator 在用戶已經熟悉的環境中運作,OpenAI 避免了對定制 API 或整合的需求。
「利用全球最受歡迎的介面,OpenAI 提升了用戶體驗,並引起了公眾的立即興趣。這種以瀏覽器為中心的方法創造了廣泛採用的巨大潛力,儘管 Anthropic 擁有早期進入優勢,但仍然在這方面面臨挑戰。」
與一些可能感覺技術性或小眾的競爭系統不同,Operator 的瀏覽器專注框架降低了進入的門檻,是 OpenAI 推進人工智慧民主化的一個步驟。
對可用性和安全性的獨特看法
Operator 的一個特點是它強調適應性和安全性,這是通過人類介入的協議實現的。Antoniou 認可了這些周到的可用性特徵,但也指出還需要更多的工作。
「在架構上,Operator 的瀏覽器整合與 Claude 的系統非常相似。兩者都涉及截取用戶瀏覽器的螢幕截圖並發送進行分析,以及通過虛擬按鍵和滑鼠動作控制螢幕。然而,Operator 引入了一些周到的可用性設計。」
「針對特定網站的自定義指令等功能增加了個性化的層次,而強調人類介入則保障了防止未經授權的行為,例如購物、發送電子郵件或申請工作,顯示出 OpenAI 對惡意網站可能帶來的安全風險的重視,但顯然還需要更多的工作來確保這個系統在各種情況下的廣泛安全。」
OpenAI 為 Operator 實施了多層次的安全框架,包括安全輸入的接管模式、重大行動前的用戶確認以及檢測對抗行為的監控系統。此外,用戶可以直接在工具內刪除瀏覽數據和管理隱私設置。
然而,Antoniou 強調這些措施仍在發展中,特別是在 Operator 遇到複雜或敏感的任務時。
OpenAI Operator 進一步民主化人工智慧
Antoniou 也認為 Operator 的發布是消費者人工智慧領域的一個關鍵時刻,儘管這仍然處於初期階段。
「總體而言,這是一次為日常用戶構建代理系統的出色初步嘗試,設計圍繞他們與技術自然互動的方式。隨著系統的發展——在增加功能和更強的安全控制的情況下——這個定價為每月 200 美元的有限推廣,將成為一個測試平台。」
「一旦成熟並擴展到更低的訂閱層和免費版本,Operator 就有潛力開創面向消費者的代理時代,進一步民主化人工智慧,並將其融入日常生活。」
最初為專業用戶設計的 Operator 價格較高,為 OpenAI 提供了向早期採用者學習並完善其能力的機會。
Antoniou 提到,雖然每月 200 美元對於大多數用戶來說可能還不值得,但如果投資於讓 Operator 更強大和可接觸,可能會為 OpenAI 在長期內帶來顯著的競爭優勢。
「這值得每月 200 美元嗎?或許尚未。但隨著系統的演變,OpenAI 的護城河將會擴大,使競爭對手更難追趕。現在,挑戰回到了 Anthropic 和 Google 的身上——這兩家公司在小眾或工程專注的產品中展現了類似的能力——需要做出回應以保持競爭力。」他總結道。
隨著 OpenAI 持續調整 Operator,改變人們與技術互動的潛力變得顯而易見。從與 Instacart、DoorDash 和 Uber 等公司的合作,到公共部門的應用案例,Operator 旨在在創新和信任、安全之間找到平衡。
雖然早期的限制和定價可能會妨礙其廣泛採用,但這些障礙可能只是暫時的,因為 OpenAI 承諾隨著時間推進來提升可用性和可接觸性。
另見:OpenAI 在印度法院反對 ChatGPT 數據刪除的辯論
想了解更多來自行業領袖的人工智慧和大數據知識嗎?查看即將在阿姆斯特丹、加利福尼亞和倫敦舉行的 AI & 大數據博覽會。這是一個綜合性活動,與其他領先活動如智能自動化大會、BlockX、數字轉型周和網絡安全與雲博覽會同時舉行。
探索由 TechForge 主辦的其他即將舉行的企業科技活動和網絡研討會。
本文由 AI 台灣 運用 AI 技術編撰,內容僅供參考,請自行核實相關資訊。
歡迎加入我們的 AI TAIWAN 台灣人工智慧中心 FB 社團,
隨時掌握最新 AI 動態與實用資訊!