在假期、年終專案、即將到來的節日和其他忙碌的事情之間,我這個月沒有寫出任何文章。所以這裡有一個我最近感到驚訝的事情清單。
我們已經虛擬化了嗎?
我並不是第一個覺得 NotebookLM 很厲害的人,也不會是最後一個。我做了一個簡單的實驗:我將它指向我最近的兩篇文章,“更好的思考”和“亨利·福特與人工智慧”。NotebookLM 提供的摘要和建議問題都相當不錯:它們不僅僅是評論這兩篇文章,還探討了它們之間的關係。但讓我驚訝的是它生成的播客:兩個合成人物之間的八分鐘討論,聽起來非常有興趣和投入。(這裡有一些 Google 使用的技術描述。)它的內容是否100%正確?不過老實說,如果一個人總結我的文章,我也許會找到幾個可以抱怨的地方。
作為 Google,初次體驗後,使用介面有點笨重。幾天後我想回去聽播客時,我不得不花太多時間去猜該點什麼。(提示:你會猜到需要點擊“Notebook 指南”嗎?為什麼播客播放器不會自動出現呢?)但這真的只是個小問題。
使用電腦的模型
Anthropic 的電腦使用 API 現在已經進入測試階段。測試階段的確有很多危險和容易濫用的地方。但這也非常有趣,並指向人工智慧發展的新方向。
簡單來說(我可能有點錯),電腦使用讓你可以告訴 Claude 如何使用電腦:瀏覽器、編輯器、命令行,任何可以在螢幕上有用戶介面的東西(甚至可能更多)。Anthropic 提供了一個作為 Docker 容器的演示,這樣你可以安全地運行它。一旦容器運行起來,你可以給 Claude 一個問題讓它解決;它會找出解決問題的方法,並使用容器的虛擬 Linux 電腦來完成工作。例如,你可以要求它填寫一個電子表格,並從網站收集數據。Claude 會為你完成所有的點擊、複製和粘貼。
這算是革命性嗎?我第一反應是“這有什麼了不起的,我可以上傳文件給 GPT 讓它幫我瀏覽網頁。”原則上這是對的,雖然 ChatGPT 不允許在同一對話中進行網頁瀏覽和文件上傳。那麼,真正的新鮮事是什麼呢?想想你需要多麼複雜的提示才能讓 GPT 讀取電子表格,找出缺少的數據,在網上尋找這些數據,並生成一個新的更新電子表格。這可不是簡單的事。有了電腦使用,大部分的複雜性就消失了。
這真的會消失嗎?我們會隨著時間的推移而發現。我們仍然處於幻覺和不當行為的階段,這些問題還算可愛而非關鍵。Claude 很容易被隨機網站上的內容誤導,將其解讀為提示。這將成為提示注入攻擊的好時機。我可以想像許多改進的空間。電腦使用目前的工作方式是截取螢幕截圖並發送給 Claude,讓它計算該點擊的位置。這似乎非常笨拙,尤其是考慮到許多應用程序具有可訪問性功能,可能使截圖變得不必要。
目前,放鬆一下,深呼吸。不要急著用電腦使用來做任何重要的事情——聽從 Anthropic 的多次警告是很重要的。但你應該玩玩它,思考它的意義。一個自動化的網頁應用測試框架,Selenium++?一個與在線供應商談判的工具?我們距離一個充滿代理的世界更近了,在那裡我們可以問電腦該做什麼,它就會為我們去做。
這可能是 CRM 的結束嗎?
在同樣的思路上:Sam Lessin 在 Twitter(我不會稱它為 X)上發表了一個非常聰明且有用的技巧。他導出了多年的電子郵件,使用 GPT 提取關鍵部分,然後上傳到 NotebookLM(是的,又是它),這樣他就可以詢問過去十年的對話。誰跟我談過?為什麼?我們談了哪些主題?這些都是有用的信息。
Sam 認為這是結束結構化客戶關係管理(CRM)軟體的時候。我不會對投資者或創始人發表意見,但他的過程讓我立刻產生共鳴。我這幾十年來與許多作者和潛在作者合作過,我的電子郵件中包含了與成千上萬人的對話。因此,當我想問“我想了解更多關於 DDOS 的事;我應該跟誰談?”時,我的第一步是去 Gmail 開始搜索。電子郵件就是我的 CRM 系統;我從未使用過商業 CRM 產品。
不幸的是,諷刺的是,Gmail 的搜索能力相當差。雖然可以讓它運作,但用它來管理聯絡人並不愉快。我可以直接問 NotebookLM 嗎?當然可以。
基於電子郵件的 CRM 甚至可能是一個不錯的創業點子,雖然很難想像能夠長期成功。因為沒有太多的“護城河”來保護創業公司免受大公司的競爭——比如 Google 自己。我可以很容易想像 Google 會將這種 AI 驅動的搜索直接整合到 Gmail 中。他們已經擁有所有數據。
這就是這個月的內容。這並不算太糟糕——也許我應該更常這樣做。
新聞來源
本文由 AI 台灣 使用 AI 編撰,內容僅供參考,請自行進行事實查核。加入 AI TAIWAN Google News,隨時掌握最新 AI 資訊!