OpenAI的操作員讓ChatGPT為您使用網絡

OpenAI 讓一些用戶試用一個新的 ChatGPT 功能，這個功能利用人工智慧來操作網頁瀏覽器，幫助用戶訂票、購買雜貨、尋找優惠，還有許多其他的網上工作。

這個新工具叫做 Operator，它是一個 AI 代理：它依賴於一個訓練過的 AI 模型，這個模型可以理解文字和圖片的指令，並找出如何使用網頁瀏覽器來執行這些指令。OpenAI 認為這個工具有潛力自動化許多日常任務和工作上的瑣事。

OpenAI 的 Operator 跟 Google 和 Anthropic 的競爭產品類似，這些產品也展示了能夠使用網路的 AI 代理。許多人認為 AI 代理是 AI 的下一個進化階段，繼聊天機器人之後，很多公司也在宣傳這些技術。大多數情況下，這些工具的能力非常有限，只是使用語言模型來自動化通常由普通軟體完成的工作。

OpenAI 的產品副總裁彼得·韋林德 (Peter Welinder) 說：「AI 正在從一個能回答問題的工具，演變成一個也能在現實世界中採取行動的工具，執行複雜的多步驟工作流程。我們將看到這對人們的生產力有很大的影響，也會影響人們能夠完成工作的質量。」

OpenAI 承認，讓 ChatGPT 使用網頁瀏覽器會帶來新的風險，並表示 Operator 有時可能會出現問題。它表示已經實施了各種新的安全措施，並計劃逐步擴展 Operator 的功能。

韋林德和 OpenAI 的計算機使用代理產品及工程負責人雅什·庫馬爾 (Yash Kumar) 說，他們的計劃是從人們使用這個工具的方式中學習。他們承認這個工具可能會進行不必要的訂票或購買，但也補充說，已經投入了很多工作來確保它在做任何風險行為之前會先詢問。「它會回到我這裡，詢問確認，然後再採取可能無法逆轉的步驟。」庫馬爾說。

OpenAI 今天還發布了一個新的「系統卡」，列出了使用 Operator 可能出現的問題。這些問題包括它可能誤解指令或偏離用戶要求的情況；可能被用戶濫用；或可能成為網路犯罪分子的攻擊目標。

庫馬爾說：「這也帶來了很多安全挑戰。因為你的攻擊面和風險面會顯著增加。」

Operator 將最初作為 ChatGPT Pro 用戶的「研究預覽」提供，這個 Pro 帳戶每月需要 200 美元。該公司表示計劃在逐步推出這個工具的同時擴大使用者的訪問權限，因為它在過程中不可避免地會犯一些錯誤。

在幾次演示中，Operator 展示了 AI 作為網路助手的潛力。這個工具有一個遠端網頁瀏覽器和一個與用戶溝通的聊天窗口。

根據 WIRED 的要求，Operator 被要求預訂從康乃狄克州新哈芬 (New Haven, Connecticut) 到華盛頓特區 (Washington, DC) 的 Amtrak 火車票。它進入了正確的網站，正確地輸入了必要的信息以顯示時刻表，然後詢問下一步該怎麼做。如果用戶已經登錄到 Amtrak 網站或有存儲信用卡信息的瀏覽器配置文件，Operator 就能夠繼續預訂票——儘管它設計上會先詢問許可。

庫馬爾要求 Operator 在舊金山的 Beretta 餐廳預訂一個桌子。這個程序進入了 OpenTable 網站，找到了正確的餐廳，並查看了可用性，然後詢問下一步該怎麼做。OpenAI 表示，它已經與多個受歡迎的網站合作，包括 OpenTable，以確保 Operator 在這些網站上運行順利。

這個新工具基於 OpenAI 的 GPT-4o AI 模型，這個模型可以感知瀏覽器和網頁，並以文字進行對話。這個工具還包含額外的訓練，幫助它理解如何在線執行任務。OpenAI 還將通過其 API 提供計算機使用代理。

新聞來源

本文由 AI 台灣 運用 AI 技術編撰，內容僅供參考，請自行核實相關資訊。
歡迎加入我們的 AI TAIWAN 台灣人工智慧中心 FB 社團，
隨時掌握最新 AI 動態與實用資訊！