OpenAI 讓一些用戶試用一個新的 ChatGPT 功能,這個功能利用人工智慧來操作網頁瀏覽器,幫助用戶訂票、購買雜貨、尋找優惠,還有許多其他的網上工作。
這個新工具叫做 Operator,它是一個 AI 代理:它依賴於一個訓練過的 AI 模型,這個模型可以理解文字和圖片的指令,並找出如何使用網頁瀏覽器來執行這些指令。OpenAI 認為這個工具有潛力自動化許多日常任務和工作上的瑣事。
OpenAI 的 Operator 跟 Google 和 Anthropic 的競爭產品類似,這些產品也展示了能夠使用網路的 AI 代理。許多人認為 AI 代理是 AI 的下一個進化階段,繼聊天機器人之後,很多公司也在宣傳這些技術。大多數情況下,這些工具的能力非常有限,只是使用語言模型來自動化通常由普通軟體完成的工作。
OpenAI 的產品副總裁彼得·韋林德 (Peter Welinder) 說:「AI 正在從一個能回答問題的工具,演變成一個也能在現實世界中採取行動的工具,執行複雜的多步驟工作流程。我們將看到這對人們的生產力有很大的影響,也會影響人們能夠完成工作的質量。」
OpenAI 承認,讓 ChatGPT 使用網頁瀏覽器會帶來新的風險,並表示 Operator 有時可能會出現問題。它表示已經實施了各種新的安全措施,並計劃逐步擴展 Operator 的功能。
韋林德和 OpenAI 的計算機使用代理產品及工程負責人雅什·庫馬爾 (Yash Kumar) 說,他們的計劃是從人們使用這個工具的方式中學習。他們承認這個工具可能會進行不必要的訂票或購買,但也補充說,已經投入了很多工作來確保它在做任何風險行為之前會先詢問。「它會回到我這裡,詢問確認,然後再採取可能無法逆轉的步驟。」庫馬爾說。
OpenAI 今天還發布了一個新的「系統卡」,列出了使用 Operator 可能出現的問題。這些問題包括它可能誤解指令或偏離用戶要求的情況;可能被用戶濫用;或可能成為網路犯罪分子的攻擊目標。
庫馬爾說:「這也帶來了很多安全挑戰。因為你的攻擊面和風險面會顯著增加。」
Operator 將最初作為 ChatGPT Pro 用戶的「研究預覽」提供,這個 Pro 帳戶每月需要 200 美元。該公司表示計劃在逐步推出這個工具的同時擴大使用者的訪問權限,因為它在過程中不可避免地會犯一些錯誤。
在幾次演示中,Operator 展示了 AI 作為網路助手的潛力。這個工具有一個遠端網頁瀏覽器和一個與用戶溝通的聊天窗口。
根據 WIRED 的要求,Operator 被要求預訂從康乃狄克州新哈芬 (New Haven, Connecticut) 到華盛頓特區 (Washington, DC) 的 Amtrak 火車票。它進入了正確的網站,正確地輸入了必要的信息以顯示時刻表,然後詢問下一步該怎麼做。如果用戶已經登錄到 Amtrak 網站或有存儲信用卡信息的瀏覽器配置文件,Operator 就能夠繼續預訂票——儘管它設計上會先詢問許可。
庫馬爾要求 Operator 在舊金山的 Beretta 餐廳預訂一個桌子。這個程序進入了 OpenTable 網站,找到了正確的餐廳,並查看了可用性,然後詢問下一步該怎麼做。OpenAI 表示,它已經與多個受歡迎的網站合作,包括 OpenTable,以確保 Operator 在這些網站上運行順利。
這個新工具基於 OpenAI 的 GPT-4o AI 模型,這個模型可以感知瀏覽器和網頁,並以文字進行對話。這個工具還包含額外的訓練,幫助它理解如何在線執行任務。OpenAI 還將通過其 API 提供計算機使用代理。
本文由 AI 台灣 運用 AI 技術編撰,內容僅供參考,請自行核實相關資訊。
歡迎加入我們的 AI TAIWAN 台灣人工智慧中心 FB 社團,
隨時掌握最新 AI 動態與實用資訊!