我們上次的預測結果如何呢?我們在2024年提到的四個熱門趨勢包括我們所稱的客製化聊天機器人——這是一種由多模態大型語言模型驅動的互動助手應用程式(檢查:我們當時還不知道,但我們其實在談論現在大家稱之為的代理人,這是目前人工智慧(AI)領域最熱門的東西);生成影片(檢查:在過去12個月中,幾乎沒有技術進步得如此之快,OpenAI和Google DeepMind在今年12月相隔一週內發布了他們的旗艦影片生成模型Sora和Veo);以及能夠執行更廣泛任務的通用型機器人(檢查:大型語言模型的好處持續滲透到科技產業的其他領域,而機器人技術位居榜首)。
我們還說過,AI生成的選舉虛假信息會無處不在,但在這裡——令人高興的是,我們錯了。今年有很多事情讓我們感到擔憂,但政治深偽技術卻少之又少。
那麼2025年會有什麼新趨勢呢?我們將忽略明顯的趨勢:你可以肯定代理人和更小、更高效的語言模型將繼續影響這個產業。相反,這裡有我們AI團隊的五個替代選擇。
1. 生成虛擬遊樂場
如果2023年是生成圖像的年份,而2024年是生成影片的年份——那接下來會是什麼呢?如果你猜是生成虛擬世界(也就是視頻遊戲),那就給自己一個高五吧。
我們在二月時稍微瞥見了這項技術,當時Google DeepMind展示了一個名為Genie的生成模型,它可以將靜態圖像轉換成側滾動的2D平台遊戲,玩家可以與之互動。在十二月,這家公司推出了Genie 2,這是一個可以將起始圖像轉換成整個虛擬世界的模型。
其他公司也在開發類似的技術。在十月,AI初創公司Decart和Etched展示了一個非官方的Minecraft黑客版本,遊戲中的每一幀都是在你玩時即時生成的。World Labs是一家由Fei-Fei Li共同創辦的初創公司——她是ImageNet的創建者,這是一個龐大的照片數據集,啟動了深度學習的熱潮——正在開發他們所稱的“大型世界模型”(LWM)。
一個明顯的應用是視頻遊戲。這些早期實驗帶有一種玩樂的語氣,生成的3D模擬可以用來探索新遊戲的設計概念,將草圖即時轉換為可玩環境。這可能會導致全新類型的遊戲誕生。
但這些技術也可以用來訓練機器人。World Labs希望開發所謂的空間智能——即機器解釋和互動日常世界的能力。但機器人研究人員缺乏良好的真實世界場景數據來訓練這項技術。生成無數虛擬世界並將虛擬機器人放入其中進行試錯學習,可能有助於彌補這一不足。
本文由 AI 台灣 運用 AI 技術編撰,內容僅供參考,請自行核實相關資訊。
歡迎加入我們的 AI TAIWAN 台灣人工智慧中心 FB 社團,
隨時掌握最新 AI 動態與實用資訊!