刮目相看 – 奧賴利 - AI TAIWAN 台灣人工智慧中心

在假期、年終專案、即將到來的節日和其他忙碌的事情之間，我這個月沒有寫出任何文章。所以這裡有一個我最近感到驚訝的事情清單。

我們已經虛擬化了嗎？

我並不是第一個覺得 NotebookLM 很厲害的人，也不會是最後一個。我做了一個簡單的實驗：我將它指向我最近的兩篇文章，“更好的思考”和“亨利·福特與人工智慧”。NotebookLM 提供的摘要和建議問題都相當不錯：它們不僅僅是評論這兩篇文章，還探討了它們之間的關係。但讓我驚訝的是它生成的播客：兩個合成人物之間的八分鐘討論，聽起來非常有興趣和投入。（這裡有一些 Google 使用的技術描述。）它的內容是否100%正確？不過老實說，如果一個人總結我的文章，我也許會找到幾個可以抱怨的地方。

作為 Google，初次體驗後，使用介面有點笨重。幾天後我想回去聽播客時，我不得不花太多時間去猜該點什麼。（提示：你會猜到需要點擊“Notebook 指南”嗎？為什麼播客播放器不會自動出現呢？）但這真的只是個小問題。

使用電腦的模型

Anthropic 的電腦使用 API 現在已經進入測試階段。測試階段的確有很多危險和容易濫用的地方。但這也非常有趣，並指向人工智慧發展的新方向。

簡單來說（我可能有點錯），電腦使用讓你可以告訴 Claude 如何使用電腦：瀏覽器、編輯器、命令行，任何可以在螢幕上有用戶介面的東西（甚至可能更多）。Anthropic 提供了一個作為 Docker 容器的演示，這樣你可以安全地運行它。一旦容器運行起來，你可以給 Claude 一個問題讓它解決；它會找出解決問題的方法，並使用容器的虛擬 Linux 電腦來完成工作。例如，你可以要求它填寫一個電子表格，並從網站收集數據。Claude 會為你完成所有的點擊、複製和粘貼。

這算是革命性嗎？我第一反應是“這有什麼了不起的，我可以上傳文件給 GPT 讓它幫我瀏覽網頁。”原則上這是對的，雖然 ChatGPT 不允許在同一對話中進行網頁瀏覽和文件上傳。那麼，真正的新鮮事是什麼呢？想想你需要多麼複雜的提示才能讓 GPT 讀取電子表格，找出缺少的數據，在網上尋找這些數據，並生成一個新的更新電子表格。這可不是簡單的事。有了電腦使用，大部分的複雜性就消失了。

這真的會消失嗎？我們會隨著時間的推移而發現。我們仍然處於幻覺和不當行為的階段，這些問題還算可愛而非關鍵。Claude 很容易被隨機網站上的內容誤導，將其解讀為提示。這將成為提示注入攻擊的好時機。我可以想像許多改進的空間。電腦使用目前的工作方式是截取螢幕截圖並發送給 Claude，讓它計算該點擊的位置。這似乎非常笨拙，尤其是考慮到許多應用程序具有可訪問性功能，可能使截圖變得不必要。

目前，放鬆一下，深呼吸。不要急著用電腦使用來做任何重要的事情——聽從 Anthropic 的多次警告是很重要的。但你應該玩玩它，思考它的意義。一個自動化的網頁應用測試框架，Selenium++？一個與在線供應商談判的工具？我們距離一個充滿代理的世界更近了，在那裡我們可以問電腦該做什麼，它就會為我們去做。

這可能是 CRM 的結束嗎？

在同樣的思路上：Sam Lessin 在 Twitter（我不會稱它為 X）上發表了一個非常聰明且有用的技巧。他導出了多年的電子郵件，使用 GPT 提取關鍵部分，然後上傳到 NotebookLM（是的，又是它），這樣他就可以詢問過去十年的對話。誰跟我談過？為什麼？我們談了哪些主題？這些都是有用的信息。

Sam 認為這是結束結構化客戶關係管理（CRM）軟體的時候。我不會對投資者或創始人發表意見，但他的過程讓我立刻產生共鳴。我這幾十年來與許多作者和潛在作者合作過，我的電子郵件中包含了與成千上萬人的對話。因此，當我想問“我想了解更多關於 DDOS 的事；我應該跟誰談？”時，我的第一步是去 Gmail 開始搜索。電子郵件就是我的 CRM 系統；我從未使用過商業 CRM 產品。

不幸的是，諷刺的是，Gmail 的搜索能力相當差。雖然可以讓它運作，但用它來管理聯絡人並不愉快。我可以直接問 NotebookLM 嗎？當然可以。

基於電子郵件的 CRM 甚至可能是一個不錯的創業點子，雖然很難想像能夠長期成功。因為沒有太多的“護城河”來保護創業公司免受大公司的競爭——比如 Google 自己。我可以很容易想像 Google 會將這種 AI 驅動的搜索直接整合到 Gmail 中。他們已經擁有所有數據。

這就是這個月的內容。這並不算太糟糕——也許我應該更常這樣做。

新聞來源

本文由 AI 台灣使用 AI 編撰，內容僅供參考，請自行進行事實查核。加入 AI TAIWAN Google News，隨時掌握最新 AI 資訊！