Google的執行長蘇達爾·皮查伊 (Sundar Pichai) 宣布推出Gemini 2.0,這是一個代表Google在人工智慧 (AI) 領域新一步驟的模型。
在推出Gemini 1.0模型一年後,這次的重大升級加入了更強大的多模態能力、代理功能,還有創新的使用者工具,旨在突破AI技術的界限。
邁向變革性的AI
皮查伊回顧了Google 26年來組織和使世界資訊可及的使命,表示:“如果Gemini 1.0是關於組織和理解資訊,那麼Gemini 2.0則是讓這些資訊變得更加有用。”
Gemini 1.0於2022年12月推出,這是Google首個本土多模態AI模型。這個版本在理解和處理文本、視頻、圖片、音頻和代碼方面表現出色。它的增強版1.5受到開發者的廣泛接受,因為它能夠長時間理解上下文,促成了像是專注於生產力的NotebookLM等應用的發展。
現在,透過Gemini 2.0,Google希望加快AI作為通用助手的角色,這個助手能夠生成圖像和音頻,更好地推理和計劃,並具備現實世界的決策能力。皮查伊表示,這一發展代表著“代理時代”的曙光。
他解釋說:“我們一直在投資開發更具代理性的模型,這意味著它們能更了解你周圍的世界,能想到多步驟的計劃,並在你的監督下為你採取行動。”
Gemini 2.0:核心特點和可用性
今天宣布的重點是Gemini 2.0 Flash的實驗性發布,這是Gemini第二代的旗艦模型。它在前身的基礎上進行了改進,提供更快的反應速度和更高的性能。
Gemini 2.0 Flash支持多模態的輸入和輸出,包括能夠生成與文本結合的本土圖像,以及產生可調整的多語言文本轉語音音頻。此外,用戶還可以從內建的工具整合中受益,例如Google搜尋,甚至是第三方用戶定義的功能。
開發者和企業將通過Google AI Studio和Vertex AI中的Gemini API訪問Gemini 2.0 Flash,而更大的模型尺寸計劃在2024年1月進行更廣泛的發布。
為了讓全球用戶都能接觸到,Gemini應用程式現在提供了針對聊天優化的2.0 Flash實驗性模型版本。早期使用者可以在桌面和手機上體驗這個更新的助手,手機應用程式的推出即將到來。
像Google搜尋這樣的產品也在透過Gemini 2.0進行升級,解鎖了處理複雜查詢的能力,例如高級數學問題、編碼查詢和多模態問題。
全面的AI創新套件
Gemini 2.0的推出伴隨著吸引人的新工具,展示其能力。
其中一個特點是Deep Research,它充當AI研究助手,簡化了調查複雜主題的過程,將資訊整理成全面的報告。另一個升級則增強了搜尋功能,提供Gemini支援的AI概述,解決複雜的多步用戶查詢。
這個模型使用Google第六代張量處理單元 (TPUs),稱為Trillium進行訓練,皮查伊指出“Trillium為100%的Gemini 2.0訓練和推理提供了支持。”
Trillium現在對外部開發者開放,讓他們也能利用支持Google自身進步的基礎設施。
開創代理體驗
隨著Gemini 2.0的推出,還有一些實驗性的“代理”原型,旨在探索人類與AI合作的未來,包括:
Project Astra:一個通用的AI助手
這個項目在今年的I/O大會上首次介紹,利用Gemini 2.0的多模態理解來改善現實世界中的AI互動。受信任的測試者已經在Android上試用這個助手,提供的反饋幫助改善了其多語言對話、記憶保持和與Google工具(如搜尋、Lens和地圖)的整合。Astra還展現了接近人類的對話延遲,並在可穿戴技術(例如原型AI眼鏡)的應用方面進行進一步研究。
Project Mariner:重新定義網頁自動化
Project Mariner是一個實驗性的網頁瀏覽助手,利用Gemini 2.0在文本、圖片和互動元素(如表單)中的推理能力。初步測試顯示,它在WebVoyager基準上完成端到端網頁任務的成功率達到了83.5%。早期使用Chrome擴展的測試者正在幫助改善Mariner的能力,同時Google也在評估安全措施,確保技術保持友好和安全。
Jules:一個為開發者設計的編碼助手
Jules是一個為開發者打造的AI助手,直接整合到GitHub工作流程中,以解決編碼挑戰。它可以自主提出解決方案、生成計劃並執行基於代碼的任務——這一切都在人工監督下進行。這是一個實驗性項目,旨在實現Google在各個領域創建多功能AI代理的長期目標。
遊戲應用及其他領域
Google DeepMind正與Supercell等遊戲合作夥伴合作,將Gemini 2.0的應用擴展到虛擬環境中,開發智能遊戲代理。這些實驗性的AI夥伴能夠即時解讀遊戲行為,建議策略,甚至通過搜索訪問更廣泛的知識。研究也在進行,探討Gemini 2.0的空間推理如何支持機器人技術,為未來的實體世界應用鋪平道路。
在AI開發中強調責任
隨著AI能力的擴展,Google強調優先考慮安全和倫理考量的重要性。
Google聲稱Gemini 2.0經歷了廣泛的風險評估,並由責任與安全委員會進行監督,以減輕潛在風險。此外,其嵌入的推理能力允許進行高級的“紅隊測試”,使開發者能夠評估安全場景並優化安全措施。
Google也在探索保障措施,以解決用戶隱私、預防濫用和確保AI代理保持可靠。例如,Project Mariner旨在優先考慮用戶指令,同時抵抗惡意提示注入,防止網路釣魚或詐騙交易等威脅。與此同時,Project Astra中的隱私控制使用戶能夠輕鬆管理會話數據和刪除偏好。
皮查伊重申了公司對負責任開發的承諾,表示:“我們堅信,建立AI的唯一方法就是從一開始就要負責任。”
隨著Gemini 2.0 Flash的發布,Google正朝著建立一個能夠改變各領域互動的通用助手的願景邁進。
想了解更多來自業界領導者的AI和大數據資訊嗎?請查看在阿姆斯特丹、加州和倫敦舉行的AI與大數據博覽會。這個綜合活動與其他領先活動(包括智能自動化會議、BlockX、數位轉型週和網路安全及雲端博覽會)同時舉辦。
探索其他即將舉行的企業科技活動和由TechForge提供的網路研討會。
新聞來源
本文由 AI 台灣 使用 AI 編撰,內容僅供參考,請自行進行事實查核。加入 AI TAIWAN Google News,隨時掌握最新 AI 資訊!