上週,《麻省理工科技評論》(MIT Technology Review)有機會在一個封閉的現場演示中體驗Astra。這是一個令人驚豔的經歷,但精緻的宣傳與現場演示之間仍有差距。
Astra使用Gemini 2.0內建的代理框架來回答問題和執行任務,透過文字、語音、圖片和視頻進行操作,並在需要時調用現有的Google應用程式,如搜尋、地圖和Lens(鏡頭)。Astra的產品經理徐必博(Bibo Xu)表示:「它結合了我們這個時代一些最強大的資訊檢索系統。」
Gemini 2.0和Astra還有Mariner,一個基於Gemini的新代理,可以為你瀏覽網頁;Jules,一個新的Gemini驅動的編程助手;以及Gemini for Games,一個實驗性的助手,你可以在玩視頻遊戲時與它聊天並請教技巧。
(別忘了,上週Google DeepMind還宣布了Veo,一個新的視頻生成模型;Imagen 3,一個新的圖像生成模型版本;以及Willow,一種新型的量子電腦晶片。哇!同時,執行長德米斯·哈薩比斯(Demis Hassabis)昨天在瑞典領取他的諾貝爾獎。)
Google DeepMind聲稱,Gemini 2.0的速度是前一版本Gemini 1.5的兩倍,並且在多個標準基準測試中表現優於它,包括MMLU-Pro,這是一組大型選擇題,旨在測試大型語言模型在數學、物理、健康、心理學和哲學等多個主題上的能力。
但是,像Gemini 2.0這樣的高端模型與來自競爭實驗室如OpenAI和Anthropic的模型之間的差距現在變得很小。如今,大型語言模型的進步不再只是看它們有多好,而是看你能用它們做什麼。
這就是代理的作用。
親身體驗Project Astra
上週,我被帶進倫敦國王十字區一棟大樓的上層樓,進入一個充滿神秘專案氛圍的房間。牆上用巨大的字母寫著「ASTRA」。徐的狗Charlie,這個專案的事實上吉祥物,在研究人員和工程師忙碌的桌子之間遊走,他們正在打造一個Google寄予厚望的產品。
新聞來源
本文由 AI 台灣 使用 AI 編撰,內容僅供參考,請自行進行事實查核。加入 AI TAIWAN Google News,隨時掌握最新 AI 資訊!